#1 Le 13/07/2021, à 02:40
- crickeur
OCR ne fonctionne pas
Bonjour à tous,
J'ai tenté de faire de l'OCR avec une multi fonction en suivant le tuto ici mais il me donne un fichier txt vide.
J'ai essayé avec les autres protocoles (GOCR, CUNEIFORM) sans plus de résultats
Voilà les informations utiles : Je suis sous Ubuntu 20.04 / J'utilise Xsane / mon multi fonction est un HP LaserJet MFP M130nw.
Toute aide est la bienvenue
Hors ligne
#2 Le 13/07/2021, à 14:39
- gl38
Re : OCR ne fonctionne pas
Il faudrait commencer par voir si tesseract fonctionne.
Tu scannes une page bien imprimée en français écrite en noir sur fond blanc, en réglant xsane sur "Trait" et une résolution de 300 et une sortie en jpg.
Tu sauves le résultat en un fichier jpg, image.jpg par exemple.
Tu ouvres un terminal et tu vas dans le dossier où tu viens de sauver ton image, ou bien tu mets l'image dans ton dossier perso et tu tapes :
tesseract image.jpg sortie -l fra
Est-ce que tu obtiens un sortie.txt qui contient du texte venant de l'image ?
Cordialement,
Guy
Hors ligne
#3 Le 13/07/2021, à 16:51
- crickeur
Re : OCR ne fonctionne pas
Merci pour ton aide, voilà ce que j'ai réalisé :
aho@aho-Inspiron-15-3552:~$ tesseract Test.jpeg sortie -l fra
Tesseract Open Source OCR Engine v4.1.1 with Leptonica
aho@aho-Inspiron-15-3552:~$
A priori cela fonctionne, puisque j'ai retrouvé un fichier texte avec le contenu du scann.
Hors ligne