[Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

Poun64 · Le 19/01/2014, à 13:19

Bonjour toul'monde !

J'ai un GPS Garmin avec mise à jour de la cartographie Europe Navteq à vie...
Je suppose que les cartes gratuites proposées par http://garmin.openstreetmap.nl/ ne sont pas du dernier cri...
Pour ce qui est du mariage "xsane / tesseract / xsane2tess" je dois en effet creuser un peu, mais l'outil ROC qui m'a été livré avec ma multifonction HP a l'air vraiment super... Il ne faut pas être un "intégriste" de Linux non plus (on me le reproche assez) !
Pour ce qui est de l'objet de ce topic "Mettre ROC en Français avec "Tesseract" sur Gscan2pdf", à vous lire, je vais devoir y mettre pour l'instant un mouchoir dessus... Reste donc des solutions de contournement...

gl38 · Le 19/01/2014, à 13:33

Les cartes d'OpenStreetMap sont mises à jour tout le temps.
J'ai même découvert que la mairie de mon bled avait donné des noms aux chemins à côté de chez moi en regardant mon gps muni d'une carte OpenStreetMap de France.
Je ne comprends pas pourquoi tu tiens absolument à utiliser gscan2pdf pour faire de la reconnaissance optique de caractères, il y a des solutions beaucoup plus pratiques et plus simples sous Ubuntu.
Cordialement,
Guy

J5012 · Le 20/01/2014, à 21:11

et puis pourquoi s'obstiner a faire afficher francais dans gscan2pdf quand le paquet tesseract-ocr fra fonctionne tout de meme ? mes docs en fr sont bien converties meme si le fr ne s'affiche pas dans gscan2pdf ...

Poun64 · Le 21/01/2014, à 00:01

Salut à tous !
A J5012 : c'est parce que j'ai remarqué qu'en mode "tesseract-ocr en français", la reconnaissance est bien meilleure...
Bon je clôture pour ma part le topic en mettant un petit [Contourné] dans le titre...
Pour le peu de ROC que j'ai à faire, mes solutions de replis seront :
- Tesseract en ligne de commande : tesseract image.jpg out.txt -l fra pour les petits textes
- Pour les fichiers volumineux, mon logiciel gratos sous Windows "Readiris" fait vraiment des merveilles. Pour peu que j'en ai vu, il rivalise avec l'Adobe Acrobat que j'ai au boulot...
Merci beaucoup à vous tous pour vos contributions...
Amicalement

Dernière modification par Poun64 (Le 21/01/2014, à 00:07)

gl38 · Le 21/01/2014, à 12:55

@J5012, Je confirme que tesseract marche beaucoup mieux sur un texte français si on lui dit d'utiliser le français plutôt que l'anglais.
Cordialement,
Guy

J5012 · Le 21/01/2014, à 20:19

oui oui, mais je vous dis que meme quand il met anglais dans la gui gscan2pdf, l'ocr est en fait en fr ! quand je dis que mes ocr passent je pensais a des ocr en fr ... bon pour le prochain ocr je testerai la cli pour voir si y a une diff ...

Poun64 · Le 22/01/2014, à 02:44

Bonsoir :

J'ai remarqué lors de mes essais, qu'un même texte en français est bien mieux reconnu en faisant en ligne de commande "tesseract image.jpg out.txt -l fra", qu'en lançant l'OCR tesseract à partir de gscan2pdf...

C'est ça qui me fait penser que l'option "fr" de Tesseract, n'est pas prise en charge dans gscan2pdf...
Mais je peux hélas me gaufrer lamentablement...

Dernière modification par Poun64 (Le 22/01/2014, à 02:46)

gl38 · Le 22/01/2014, à 11:55

Chez moi, le résultat est le même avec gscan2pdf 1.2.2 (obtenu par le ppa que tu as indiqué au #13) et en ligne de commande, par contre si on choisit l'anglais, il y a beaucoup plus de fautes.
Cordialement,
Guy

Ubuntu-fr

Navigation

Liens de recherche

Annonce

#26 Le 19/01/2014, à 13:19

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

#27 Le 19/01/2014, à 13:33

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

#28 Le 20/01/2014, à 21:11

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

#29 Le 21/01/2014, à 00:01

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

#30 Le 21/01/2014, à 12:55

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

#31 Le 21/01/2014, à 20:19

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

#32 Le 22/01/2014, à 02:44

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

#33 Le 22/01/2014, à 11:55

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

Pied de page des forums