Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#26 Le 19/01/2014, à 13:19

Poun64

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

Bonjour toul'monde smile !

J'ai un GPS Garmin avec mise à jour de la cartographie Europe Navteq à vie...
Je suppose que les cartes gratuites proposées par http://garmin.openstreetmap.nl/ ne sont pas du dernier cri...
Pour ce qui est du mariage "xsane / tesseract / xsane2tess" je dois en effet creuser un peu, mais l'outil ROC qui m'a été livré avec ma multifonction HP a l'air vraiment super... Il ne faut pas être un "intégriste" de Linux non plus (on me le reproche assez) !
Pour ce qui est de l'objet de ce topic "Mettre ROC en Français avec "Tesseract" sur Gscan2pdf", à vous lire, je vais devoir y mettre pour l'instant un mouchoir dessus... Reste donc des solutions de contournement...
tongue


1) Xubuntu 22.04._LTS + Windows 10 - Gigabyte GA H77M - Intel Core I7 3770K / HD Graphics 4000 - 4 cœurs - 3,5 Ghz - 16 Go de RAM
2) Xubuntu 22.04._LTS + Windows 10 - Gigabyte H610M S2H - Intel I3-12100 / UHD Graphics 730 intégré - 4 cœurs - 3,3 Ghz - 16 Go de RAM
3) Xubuntu 22.04._LTS  - NetBook ACER TravelMate - Intel Celeron N4020 - 2 cœurs - 1,1 Ghz - 4 Go de RAM - Intel UHD Graphics 605

Hors ligne

#27 Le 19/01/2014, à 13:33

gl38

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

Les cartes d'OpenStreetMap sont mises à jour tout le temps.
J'ai même découvert que la mairie de mon bled avait donné des noms aux chemins à côté de chez moi en regardant mon gps muni d'une carte OpenStreetMap de France.
Je ne comprends pas pourquoi tu tiens absolument à utiliser gscan2pdf pour faire de la reconnaissance optique de caractères, il y a des solutions beaucoup plus pratiques et plus simples sous Ubuntu.
Cordialement,
Guy

Hors ligne

#28 Le 20/01/2014, à 21:11

J5012

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

et puis pourquoi s'obstiner a faire afficher francais dans gscan2pdf quand le paquet tesseract-ocr fra fonctionne tout de meme ? mes docs en fr sont bien converties meme si le fr ne s'affiche pas dans gscan2pdf ...

Hors ligne

#29 Le 21/01/2014, à 00:01

Poun64

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

Salut à tous !
A J5012 : c'est parce que j'ai remarqué qu'en mode "tesseract-ocr en français", la reconnaissance est bien meilleure...
Bon je clôture pour ma part le topic en mettant un petit [Contourné] dans le titre...
Pour le peu de ROC que j'ai à faire, mes solutions de replis seront :
- Tesseract en ligne de commande : tesseract image.jpg out.txt -l fra pour les petits textes
- Pour les fichiers volumineux, mon logiciel gratos sous Windows "Readiris" fait vraiment des merveilles. Pour peu que j'en ai vu, il rivalise avec l'Adobe Acrobat que j'ai au boulot...
Merci beaucoup à vous tous pour vos contributions...
Amicalement
smile

Dernière modification par Poun64 (Le 21/01/2014, à 00:07)


1) Xubuntu 22.04._LTS + Windows 10 - Gigabyte GA H77M - Intel Core I7 3770K / HD Graphics 4000 - 4 cœurs - 3,5 Ghz - 16 Go de RAM
2) Xubuntu 22.04._LTS + Windows 10 - Gigabyte H610M S2H - Intel I3-12100 / UHD Graphics 730 intégré - 4 cœurs - 3,3 Ghz - 16 Go de RAM
3) Xubuntu 22.04._LTS  - NetBook ACER TravelMate - Intel Celeron N4020 - 2 cœurs - 1,1 Ghz - 4 Go de RAM - Intel UHD Graphics 605

Hors ligne

#30 Le 21/01/2014, à 12:55

gl38

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

@J5012, Je confirme que tesseract marche beaucoup mieux sur un texte français si on lui dit d'utiliser le français plutôt que l'anglais.
Cordialement,
Guy

Hors ligne

#31 Le 21/01/2014, à 20:19

J5012

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

oui oui, mais je vous dis que meme quand il met anglais dans la gui gscan2pdf, l'ocr est en fait en fr ! quand je dis que mes ocr passent je pensais a des ocr en fr ... bon pour le prochain ocr je testerai la cli pour voir si y a une diff ...

Hors ligne

#32 Le 22/01/2014, à 02:44

Poun64

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

Bonsoir smile :

J'ai remarqué lors de mes essais, qu'un même texte en français est bien mieux reconnu en faisant en ligne de commande "tesseract image.jpg out.txt -l fra", qu'en lançant l'OCR tesseract à partir de gscan2pdf...

C'est ça qui me fait penser que l'option "fr" de Tesseract, n'est pas prise en charge dans gscan2pdf...
Mais je peux hélas me gaufrer lamentablement...

smile

Dernière modification par Poun64 (Le 22/01/2014, à 02:46)


1) Xubuntu 22.04._LTS + Windows 10 - Gigabyte GA H77M - Intel Core I7 3770K / HD Graphics 4000 - 4 cœurs - 3,5 Ghz - 16 Go de RAM
2) Xubuntu 22.04._LTS + Windows 10 - Gigabyte H610M S2H - Intel I3-12100 / UHD Graphics 730 intégré - 4 cœurs - 3,3 Ghz - 16 Go de RAM
3) Xubuntu 22.04._LTS  - NetBook ACER TravelMate - Intel Celeron N4020 - 2 cœurs - 1,1 Ghz - 4 Go de RAM - Intel UHD Graphics 605

Hors ligne

#33 Le 22/01/2014, à 11:55

gl38

Re : [Contourné] Mettre ROC en Français avec "Tesseract" sur Gscan2pdf

Chez moi, le résultat est le même avec gscan2pdf 1.2.2 (obtenu par le ppa que tu as indiqué au #13) et en ligne de commande, par contre si on choisit l'anglais, il y a beaucoup plus de fautes.
Cordialement,
Guy

Hors ligne