Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 13/07/2021, à 02:40

crickeur

OCR ne fonctionne pas

Bonjour à tous,
J'ai tenté de faire de l'OCR avec une multi fonction en suivant le tuto ici mais il me donne un fichier txt vide.

J'ai essayé avec les autres protocoles (GOCR, CUNEIFORM) sans plus de résultats

Voilà les informations utiles : Je suis sous Ubuntu 20.04 / J'utilise Xsane / mon multi fonction est un HP LaserJet MFP M130nw.

Toute aide est la bienvenue cool

Hors ligne

#2 Le 13/07/2021, à 14:39

gl38

Re : OCR ne fonctionne pas

Il faudrait commencer par voir si tesseract fonctionne.
Tu scannes une page bien imprimée en français écrite en noir sur fond blanc, en réglant xsane sur "Trait" et une résolution de 300 et une sortie en jpg.
Tu sauves le résultat en un fichier jpg, image.jpg par exemple.
Tu ouvres un terminal et tu vas dans le dossier où tu viens de sauver ton image, ou bien tu mets l'image dans ton dossier perso et tu tapes :

tesseract image.jpg sortie -l fra

Est-ce que tu obtiens un sortie.txt qui contient du texte venant de l'image ?
Cordialement,
Guy

Hors ligne

#3 Le 13/07/2021, à 16:51

crickeur

Re : OCR ne fonctionne pas

Merci pour ton aide, voilà ce que j'ai réalisé :

 aho@aho-Inspiron-15-3552:~$ tesseract Test.jpeg sortie -l fra
Tesseract Open Source OCR Engine v4.1.1 with Leptonica
aho@aho-Inspiron-15-3552:~$ 
  


A priori cela fonctionne, puisque j'ai retrouvé un fichier texte avec le contenu du scann.

Hors ligne