OCR ne fonctionne pas

crickeur · Le 13/07/2021, à 02:40

Bonjour à tous,
J'ai tenté de faire de l'OCR avec une multi fonction en suivant le tuto ici mais il me donne un fichier txt vide.

J'ai essayé avec les autres protocoles (GOCR, CUNEIFORM) sans plus de résultats

Voilà les informations utiles : Je suis sous Ubuntu 20.04 / J'utilise Xsane / mon multi fonction est un HP LaserJet MFP M130nw.

Toute aide est la bienvenue

gl38 · Le 13/07/2021, à 14:39

Il faudrait commencer par voir si tesseract fonctionne.
Tu scannes une page bien imprimée en français écrite en noir sur fond blanc, en réglant xsane sur "Trait" et une résolution de 300 et une sortie en jpg.
Tu sauves le résultat en un fichier jpg, image.jpg par exemple.
Tu ouvres un terminal et tu vas dans le dossier où tu viens de sauver ton image, ou bien tu mets l'image dans ton dossier perso et tu tapes :

tesseract image.jpg sortie -l fra

Est-ce que tu obtiens un sortie.txt qui contient du texte venant de l'image ?
Cordialement,
Guy

crickeur · Le 13/07/2021, à 16:51

Merci pour ton aide, voilà ce que j'ai réalisé :

 aho@aho-Inspiron-15-3552:~$ tesseract Test.jpeg sortie -l fra
Tesseract Open Source OCR Engine v4.1.1 with Leptonica
aho@aho-Inspiron-15-3552:~$

A priori cela fonctionne, puisque j'ai retrouvé un fichier texte avec le contenu du scann.

Ubuntu-fr

Navigation

Liens de recherche

Annonce

#1 Le 13/07/2021, à 02:40

OCR ne fonctionne pas

#2 Le 13/07/2021, à 14:39

Re : OCR ne fonctionne pas

#3 Le 13/07/2021, à 16:51

Re : OCR ne fonctionne pas

Pied de page des forums