Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#26 Le 04/02/2011, à 11:38

Mathieu147

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Un truc génial aussi avec Cuneiform (et qui est visible dans mon exemple ci dessus), c'est que, quand un mot est coupé en deux avec un tiret en fin de ligne (comme le mot «travailler» dans mon exemple), il est réassemblé dans le texte produit smile

Ce qui manque, je trouve, c'est une correction automatique des textes lorsque le programme hésite entre deux lettres. J'ai parfois des I à la place des l (i majuscule à la place de L minuscule) ou bien des trucs comme «retnplacer». Je suis pratiquement certain que ce genre d'erreur pourrait être évité en regardant dans des dictionnaires.

J'ai 234 pages à OCRiser… Je les avais laissées dans un coin en attendant de trouver une solution d'OCR qui fonctionne bien, et là je dois dire que je suis content, ça marche bien! Le seul truc ennuyeux, c'est que ce ne sont pas des pages scannées (mon scanner est suuuuper lent ça m'aurait pris des années) mais des pages photographiées. Du coup, j'ai souvent un effet de perspective assez ennuyeux. Ça embrouille pas mal Cuneiform, mais on peut corriger le problème assez simplement avec l'outil perspective de Gimp.

Là, j'ai déjà eu le courage de faire 14 pages big_smile (OCR avec correction préalable éventuelle avec Gimp, copier/coller dans OOo, correction d'orthographe, un peu de mise en page).

Dernière modification par Mathieu147 (Le 04/02/2011, à 11:39)


Pffff…

Hors ligne

#27 Le 04/02/2011, à 12:35

TraGiKomiK

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

abo big_smile


Merci de mettre [RESOLU] dans le titre de votre post une fois le  probleme reglé!

GNU/Linux -> \o/

Hors ligne

#28 Le 24/02/2011, à 08:11

papamaxou

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Un grand merci Yarland. Cela marche parfaitement.

Dernière modification par papamaxou (Le 24/02/2011, à 08:15)


Laisse braire, passe au libre !

Hors ligne

#29 Le 24/02/2011, à 08:29

serged

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

J'ai connu dans ma jeunesse, un des développeurs de Cuneiform et je l'ai utilisé longtemps sous Windows. Quel ne fut ma joie de le retrouver dans les packages Ubuntu !

Pour info, la version pour le français doit beaucoup au dico de René Cougnenc, ce développeur, René et moi-même fréquentant les mêmes BSS (et mêmes bars...).


LinuxMint Vera Cinnamon et d'autres machines en MATE, XFCE... 20.x , 21.x ou 19.x
Tour : Asus F2A55 / AMD A8-5600K APU 3,6GHz / RAM 16Go / Nvidia GeForce GT610 / LM21.1 Cinnamon
Portable : LDLC Mercure MH : Celeron N3450 /RAM 4Go / Intel HD graphics 500 i915 / biboot Win 10 (sur SSD) - LM21.1 MATE (sur HDD)

Hors ligne

#30 Le 22/05/2011, à 08:44

Django84

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Absolument génial !
cuneiform fonctionne parfaitement pour du français, certes, mais ça marche aussi très bien pour le russe.
Ainsi j'ai testé en scannant un document en russe puis en remplaçant la commande (dans xsane) :
" cuneiform -l fra "   par  "  cuneiform -l rus  "   que cela produit un fichier texte en Russe !
Bon il fallait s'y attendre car cuneiform est multilangue.


GA-H170-D3HP ; i5 6600 NeonKDE ver:6.0 sur SSD Nvme

Hors ligne

#31 Le 23/05/2011, à 07:04

serged

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Django84 a écrit :

Absolument génial !
cuneiform fonctionne parfaitement pour du français, certes, mais ça marche aussi très bien pour le russe.
Ainsi j'ai testé en scannant un document en russe puis en remplaçant la commande (dans xsane) :
" cuneiform -l fra "   par  "  cuneiform -l rus  "   que cela produit un fichier texte en Russe !
Bon il fallait s'y attendre car cuneiform est multilangue.

Cela peut sembler normal : Cuneiform a été développé par des russes... wink


LinuxMint Vera Cinnamon et d'autres machines en MATE, XFCE... 20.x , 21.x ou 19.x
Tour : Asus F2A55 / AMD A8-5600K APU 3,6GHz / RAM 16Go / Nvidia GeForce GT610 / LM21.1 Cinnamon
Portable : LDLC Mercure MH : Celeron N3450 /RAM 4Go / Intel HD graphics 500 i915 / biboot Win 10 (sur SSD) - LM21.1 MATE (sur HDD)

Hors ligne

#32 Le 04/09/2011, à 06:17

gui85

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

quelle est la marche a suivre pour un texte en italien??
smile
je compte essayer car avec tesseract b52, mon resultat est pas top

Hors ligne

#33 Le 04/09/2011, à 13:51

:!pakman

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Sympa ce fil !
Intéressant et pratique, merci !

Dernière modification par :!pakman (Le 04/09/2011, à 13:51)


...

Hors ligne

#34 Le 04/09/2011, à 20:38

marceldo

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Bonjour

j'ai suivi les instruction mais chez moi cela ne marche ni dans Xane, ni en ligne de commande

voici ce que donne la ligne de commande

do@ordidomi:~$ cd Bureau
do@ordidomi:~/Bureau$ cuneiform -l fra -o out.txt out.tiff
Cuneiform for Linux 0.7.0
*** buffer overflow detected ***: cuneiform terminated
======= Backtrace: =========
/lib/libc.so.6(__fortify_fail+0x50)[0x2e0970]
/lib/libc.so.6(+0xe486a)[0x2df86a]
/usr/lib/cuneiform/libfon32.so(+0x225fb)[0x7115fb]
/usr/lib/cuneiform/libfon32.so(+0x22e24)[0x711e24]
/usr/lib/cuneiform/libfon32.so(FONRecog2Glue+0x217)[0x6fcef7]
/usr/lib/cuneiform/libpass2.so(+0x6038)[0x4ba038]
/usr/lib/cuneiform/libpass2.so(+0x626d)[0x4ba26d]
/usr/lib/cuneiform/libpass2.so(+0x90bd)[0x4bd0bd]
/usr/lib/cuneiform/libpass2.so(p2_proc+0xb4c)[0x4be8ac]
/usr/lib/cuneiform/librstr.so(+0xa4831)[0x1040831]
/usr/lib/cuneiform/librstr.so(RSTRRecognizeMain+0x237)[0x1054b57]
/usr/lib/cuneiform/librstr.so(RSTRRecognize+0x2c)[0x10558ec]
/usr/lib/cuneiform/librstr.so(RSTR_Recog+0x24)[0x1055954]
/usr/lib/cuneiform/libpuma.so(+0xade8)[0x692de8]
/usr/lib/cuneiform/libpuma.so(PUMA_XFinalRecognition+0xf3)[0x694753]
cuneiform[0x804a5d6]
/lib/libc.so.6(__libc_start_main+0xe7)[0x211ce7]
cuneiform[0x8049501]
======= Memory map: ========
00110000-001ef000 r-xp 00000000 08:07 11800149   /usr/lib/libstdc++.so.6.0.14
001ef000-001f3000 r--p 000de000 08:07 11800149   /usr/lib/libstdc++.so.6.0.14
001f3000-001f4000 rw-p 000e2000 08:07 11800149   /usr/lib/libstdc++.so.6.0.14
001f4000-001fb000 rw-p 00000000 00:00 0 
001fb000-00352000 r-xp 00000000 08:07 2621747    /lib/libc-2.12.1.so
00352000-00354000 r--p 00157000 08:07 2621747    /lib/libc-2.12.1.so
00354000-00355000 rw-p 00159000 08:07 2621747    /lib/libc-2.12.1.so
00355000-00358000 rw-p 00000000 00:00 0 
00358000-00362000 r-xp 00000000 08:07 11811187   /usr/lib/cuneiform/libcfio.so
00362000-00363000 r--p 00009000 08:07 11811187   /usr/lib/cuneiform/libcfio.so
00363000-00364000 rw-p 0000a000 08:07 11811187   /usr/lib/cuneiform/libcfio.so
00364000-00366000 rw-p 00000000 00:00 0 
00366000-00372000 r-xp 00000000 08:07 11811188   /usr/lib/cuneiform/libcimage.so
00372000-00373000 r--p 0000b000 08:07 11811188   /usr/lib/cuneiform/libcimage.so
00373000-00374000 rw-p 0000c000 08:07 11811188   /usr/lib/cuneiform/libcimage.so
00374000-00397000 r-xp 00000000 08:07 11811208   /usr/lib/cuneiform/librblock.so
00397000-00398000 r--p 00023000 08:07 11811208   /usr/lib/cuneiform/librblock.so
00398000-00399000 rw-p 00024000 08:07 11811208   /usr/lib/cuneiform/librblock.so
00399000-0039e000 rw-p 00000000 00:00 0 
0039e000-003c6000 r-xp 00000000 08:07 11811212   /usr/lib/cuneiform/librfrmt.so
003c6000-003c7000 r--p 00027000 08:07 11811212   /usr/lib/cuneiform/librfrmt.so
003c7000-003c8000 rw-p 00028000 08:07 11811212   /usr/lib/cuneiform/librfrmt.so
003c8000-003cc000 rw-p 00000000 00:00 0 
003cc000-003e3000 r-xp 00000000 08:07 11811213   /usr/lib/cuneiform/librimage.so
003e3000-003e4000 r--p 00016000 08:07 11811213   /usr/lib/cuneiform/librimage.so
003e4000-003e5000 rw-p 00017000 08:07 11811213   /usr/lib/cuneiform/librimage.so
003e5000-003e6000 rw-p 00000000 00:00 0 
003e6000-003f2000 r-xp 00000000 08:07 11811219   /usr/lib/cuneiform/librout.so
003f2000-003f3000 r--p 0000c000 08:07 11811219   /usr/lib/cuneiform/librout.so
003f3000-003f5000 rw-p 0000d000 08:07 11811219   /usr/lib/cuneiform/librout.so
003f5000-003f7000 rw-p 00000000 00:00 0 
003f7000-00402000 r-xp 00000000 08:07 11811228   /usr/lib/cuneiform/librverline.so
00402000-00403000 r--p 0000a000 08:07 11811228   /usr/lib/cuneiform/librverline.so
00403000-00404000 rw-p 0000b000 08:07 11811228   /usr/lib/cuneiform/librverline.so
00404000-0044d000 rw-p 00000000 00:00 0 
0044d000-00476000 r-xp 00000000 08:07 11811200   /usr/lib/cuneiform/liblns32.so
00476000-00477000 r--p 00028000 08:07 11811200   /usr/lib/cuneiform/liblns32.so
00477000-00478000 rw-p 00029000 08:07 11811200   /usr/lib/cuneiform/liblns32.so
00478000-00479000 rw-p 00000000 00:00 0 
00479000-00482000 r-xp 00000000 08:07 11811229   /usr/lib/cuneiform/libsmetric.so
00482000-00483000 r--p 00008000 08:07 11811229   /usr/lib/cuneiform/libsmetric.so
00483000-00484000 rw-p 00009000 08:07 11811229   /usr/lib/cuneiform/libsmetric.so
00484000-00491000 r-xp 00000000 08:07 11811210   /usr/lib/cuneiform/librcutp.so
00491000-00492000 r--p 0000c000 08:07 11811210   /usr/lib/cuneiform/librcutp.so
00492000-00494000 rw-p 0000d000 08:07 11811210   /usr/lib/cuneiform/librcutp.so
00494000-004b4000 rw-p 00000000 00:00 0 
004b4000-004c1000 r-xp 00000000 08:07 11811204   /usr/lib/cuneiform/libpass2.so
004c1000-004c2000 ---p 0000d000 08:07 11811204   /usr/lib/cuneiform/libpass2.so
004c2000-004c3000 r--p 0000d000 08:07 11811204   /usr/lib/cuneiform/libpass2.so
004c3000-004c4000 rw-p 0000e000 08:07 11811204   /usr/lib/cuneiform/libpass2.so
004c4000-004c7000 rw-p 00000000 00:00 0 
004c7000-004e5000 r-xp 00000000 08:07 11811207   /usr/lib/cuneiform/librbal.so
004e5000-004e6000 r--p 0001d000 08:07 11811207   /usr/lib/cuneiform/librbal.so
004e6000-004e7000 rw-p 0001e000 08:07 11811207   /usr/lib/cuneiform/librbal.so
004e7000-004e8000 rw-p 00000000 00:00 0 
004e8000-004ef000 r-xp 00000000 08:07 11811223   /usr/lib/cuneiform/librsadd.so
004ef000-004f0000 r--p 00006000 08:07 11811223   /usr/lib/cuneiform/librsadd.so
004f0000-004f1000 rw-p 00007000 08:07 11811223   /usr/lib/cuneiform/librsadd.so
004f4000-00501000 r-xp 00000000 08:07 11811190   /usr/lib/cuneiform/libcpage.so
00501000-00502000 r--p 0000c000 08:07 11811190   /usr/lib/cuneiform/libcpage.so
00502000-00503000 rw-p 0000d000 08:07 11811190   /usr/lib/cuneiform/libcpage.so
00503000-0051a000 r-xp 00000000 08:07 11811199   /usr/lib/cuneiform/libleo32.so
0051a000-0051b000 r--p 00016000 08:07 11811199   /usr/lib/cuneiform/libleo32.so
0051b000-0051c000 rw-p 00017000 08:07 11811199   /usr/lib/cuneiform/libleo32.so
0051c000-00521000 rw-p 00000000 00:00 0 
00521000-00527000 r-xp 00000000 08:07 11811206   /usr/lib/cuneiform/libr3532.so
00527000-00528000 r--p 00005000 08:07 11811206   /usr/lib/cuneiform/libr3532.so
00528000-00529000 rw-p 00006000 08:07 11811206   /usr/lib/cuneiform/libr3532.so
00529000-0052c000 rw-p 00000000 00:00 0 
0052c000-0052e000 r-xp 00000000 08:07 2621750    /lib/libdl-2.12.1.so
0052e000-0052f000 r--p 00001000 08:07 2621750    /lib/libdl-2.12.1.so
0052f000-00530000 rw-p 00002000 08:07 2621750    /lib/libdl-2.12.1.so
00531000-0054d000 r-xp 00000000 08:07 2621744    /lib/ld-2.12.1.so
0054d000-0054e000 r--p 0001b000 08:07 2621744    /lib/ld-2.12.1.so
0054e000-0054f000 rw-p 0001c000 08:07 2621744    /lib/ld-2.12.1.so
0054f000-00557000 r-xp 00000000 08:07 11811193   /usr/lib/cuneiform/libctb32.so
00557000-00558000 r--p 00007000 08:07 11811193   /usr/lib/cuneiform/libctb32.so
00558000-00559000 rw-p 00008000 08:07 11811193   /usr/lib/cuneiform/libctb32.so
00559000-0056a000 rw-p 00000000 00:00 0 
0056a000-0056e000 r-xp 00000000 08:07 11811203   /usr/lib/cuneiform/libmsk32.soAbandon

On voit sur la dernière ligne un abandon de la procédure

merci de vos éclaircissements


Celui qui n'avance pas... recule

Hors ligne

#35 Le 05/09/2011, à 13:15

gl38

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

J'ai obtenu le même message d'erreur avec une image scannée à 600 dpi.
Le mode d'emploi allemand recommandant 300 dpi j'ai recommencé et oh miracle !, ça marche correctement.
Ça marche aussi avec un fichier  png, par contre je n'ai pas réussi avec un jpeg donné par xsane.
Cordialement,
Guy

Hors ligne

#36 Le 05/09/2011, à 13:40

marceldo

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Merci effectivement cela fonctionne en 300 dpi alors que dans le fil de discussion pour certains cela fonctionne à priori en 600 dpi.


Celui qui n'avance pas... recule

Hors ligne

#37 Le 05/09/2011, à 14:01

fredh027

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Bonjour,
cuneiform est en effet tellement plus efficace que les autres solution d'ocr testées.
Pour son interface graphique, outre xsane, il y a aussi yagf qui est très convivial: un paquet deb est disponible ici:
http://gnu.ethz.ch/debian/yagf/

Dernière modification par fredh027 (Le 05/09/2011, à 14:01)


Linux Debian/Kubuntu/Mint sur plus de 80 stations en milieu scolaire...

Hors ligne

#38 Le 05/09/2011, à 14:11

AnsuzPeorth

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Bjr,
Est ce qu'il est capable de lire les captcha google (reCaptcha) ?
http://www.google.com/recaptcha/learnmore

J'ai voulu l'instaler, mais +30 Mo nécessaire ... Pour un soft qui ne me servira sans doute jamais.

Alors, si une âme charitable a 5 mn à perdre ...

thx.


Interface graphique pour bash, python ou autre: glade2script
Support Tchat: http://chat.jabberfr.org/muckl_int/inde … ade2script  (Hors ligne)

Hors ligne

#39 Le 05/09/2011, à 15:00

yarland

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Bonjour à tous.
Je content que Marceldo soit parvenu à ses fins, un grand merci à gl38.
Gui85, je ne sais comment te répondre, peut-être qu'une nouvelle contribution de gl38 te permettrait de traiter ton texte en italien. Tiens-nous informé.
AnsuzPeorth, je veux bien passer plus de 5 minutes avec toi, mais je ne suis pas sur de bien comprendre ta question. N'hésites pas à nous en dire plus.
J'espère n'oublier personne.
Bon vent à tous les OCReurs ...


MSI G31 M - Dual 2 core - 2mb RAM DDR2 - Ecran 24'' - DD 2 x 500Go

Hors ligne

#40 Le 05/09/2011, à 15:05

AnsuzPeorth

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

yarland a écrit :

...
AnsuzPeorth, je veux bien passer plus de 5 minutes avec toi, mais je ne suis pas sur de bien comprendre ta question. N'hésites pas à nous en dire plus.
...

ben j'aurais aimer savoir si cuneiform était capable de lire les captcha google. (cf lien au dessus)

Une image de ce genre:
image


Interface graphique pour bash, python ou autre: glade2script
Support Tchat: http://chat.jabberfr.org/muckl_int/inde … ade2script  (Hors ligne)

Hors ligne

#41 Le 05/09/2011, à 15:32

gl38

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Pour un texte en italien, en ligne de commande :

cuneiform -l ita image.png
(-l comme language)

sur un fichier png à 300 dpi. J'obtiens un résultat qui me semble parfait avec un texte de taille raisonnable, les accents sont corrects.

Ou avec yagf, choisir l'italien et avec le format html, le texte que j'ai scanné me semble identique, gras et italique sont reconnus.

Cordialement,
Guy

Dernière modification par gl38 (Le 05/09/2011, à 15:45)

Hors ligne

#42 Le 05/09/2011, à 20:30

®om

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Mathieu147 a écrit :

Punaise Cuneiform ça marche super bien.

Image de départ:
http://img19.imageshack.us/img19/4025/screenshot1ce.png
Texte résultat:

Avant d'aborder le thème proprement dit de cet ouvrage, la manière de travailler le cheval, il faut que nous nous mettions d'accord sur les moyens dont l'homme dispose à cet effet. Par ce terme de moyens, je ne veux pas dire les accessoires dont il se sert au cours de son travail : bride, selle, éperons, cravache, longe, piliers, auxquels nous ne consacrerons pas de chapitre particulier, mais seulement quelques remarques à l'occasion ; ce que je désigne par là, c'est l'usage que l'homme fait de son propre corps, quand il travaille le cheval. Cet usage de ses membres ne sera juste et ne conduira au but que s'il repose, à tout point de vue, sur une intelligence approfondie de la nature du cheval et sur la connaissance exacte de sa constitution physiologique. Ainsi compris, les moyens de travailler le cheval sont en premier lieu : une position du cavalier adéquate et conforme à la nature, et, partant de cette position, le juste emploi de ses membres agissant comme aides sur l'animal.

À noter que je n'ai posté ici qu'une partie du texte de départ qui contient en fait plusieurs paragraphes. Cuneiform détecte les paragraphes smile

On voit que j'ai les accents: j'ai utilisé l'option

cuneiform -l fra

pour mettre Cuneiform en Français. Essayez peut-être de mettre cette commande dans Xsane?

J'ai pris ton image (screenshot1ce.png), et j'ai exécuté :

cuneiform -l fra -o texte.txt screenshot1ce.png

Résultat dans texte.txt :

P

Y'a comme un problème…

Hors ligne

#43 Le 05/09/2011, à 20:41

gl38

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

C'est que le fichier screenshot1ce.png n'a que 72 dpi : on n'a pas l'original !
Avec un fichier qui a la bonne définition, cuneiform est vraiment très bon.
Cordialement,
Guy

Hors ligne

#44 Le 27/09/2011, à 18:06

joggerfou

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Bonsoir
je suis cette discussion avec attention
J'essaie d'utiliser cuneiform avec xsane
J'ai bien paramétrer dans xsane

Commande OCR : cuneiform -l fra
Option de fichier d'entrée : -i
Option de fichier de sortie : -o

Ensuite
Je lance le scan par le biais de la commande "Acquisition de l'aperçu". Le scanner fonctionne sans souci
Ensuite je fais les réglalges suisvants
Type TXT
Mode de numérisation : Gris (je n'ai pas le choix noir et blanc)
J'ai aussi le choix entre Pleine echelle couleur/ Dia /.....
DPI : 300 ou 600 cela ne change rien

Lorsque le sacn se termine, mon fichier texte fait 0 octet.
Alors qu'avec gocr j'obtiens quelque chose

Si quelqu'un avait une idée. Merci d'avance

Dernière modification par joggerfou (Le 27/09/2011, à 18:07)


J'ai découvert Ubuntu et j'en suis fan
Ubuntu 16.04 64 bits
Utilisateur de libreoffice : http://fr.libreoffice.org/
http://www.lolica.org

Hors ligne

#45 Le 27/09/2011, à 19:16

fredh027

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Pour répondre à joggerfou, quitte à me répéter, pour couper court aux problèmes sous xsane, il y a yagf qui est très bien fait, et qui permet de scanner ou de partir d'un image déjà numérisée au préalable. Je n'ai rien contre xsane que j'utilise par ailleurs pour mes numérisations d'image, mais pour l'ocr, yagf est un frontend qui me semble bien mieux adapté
le paquet deb est ici


Linux Debian/Kubuntu/Mint sur plus de 80 stations en milieu scolaire...

Hors ligne

#46 Le 27/09/2011, à 19:35

gl38

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Avec xsane, il faut utiliser la couleur "Trait" pour avoir du noir et blanc qui est la seule manière d'obtenir un bon résultat.
Sur le site allemand, il y a un script pour appeler cuneiform depuis xsane, copié de la page du site d'ubuntu français pour tesseract.

Pour yagf, c'est bien, mais il y a le site qui donne accès à la version 0.8.7 qui sait faire quelque chose d'un fichier pdf, à compiler soi-même.
Cordialement,
Guy

Hors ligne

#47 Le 27/09/2011, à 21:02

mloupiot

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Bonsoir,
@ joggerfou Peut-être est-ce le même problème qu'avec xsane2tess (permettant d'utiliser tesseract avec xsane) : le fichier .txt est vide s'il y a une espace dans le nom du chemin.

Documentation xsane2tess a écrit :

Attention : pas d'espace dans les noms des chemins (des répertoires) ou des fichiers (indiqués dans la fenêtre d'Xsane) pour effectuer la reconnaissance optique de caractère.

Cela dit, après avoir lu vos avis, bien envie d'essayer cuneiform même si tesseract + xsane2tess donnent de bons résultats (pour l'usage que j'en fais).

Hors ligne

#48 Le 27/09/2011, à 21:47

joggerfou

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Merci à tous pour vos réponses
Je ferais des tests et vous donnerais les résultats


J'ai découvert Ubuntu et j'en suis fan
Ubuntu 16.04 64 bits
Utilisateur de libreoffice : http://fr.libreoffice.org/
http://www.lolica.org

Hors ligne

#49 Le 28/09/2011, à 07:28

joggerfou

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

Bonjour à tous
@fredh027 :

 je veux bien essayer yagf mais je ne trouve pas le deb compatible 64 bits

@mloupiot :

non aucun espace. le fichier crée est dans /home/utilisateur/ et je le nomme toto.txt

@gl38 :

cela fonctionne en mode trait et avec une résolution de 300 dpii

Merci à tous


J'ai découvert Ubuntu et j'en suis fan
Ubuntu 16.04 64 bits
Utilisateur de libreoffice : http://fr.libreoffice.org/
http://www.lolica.org

Hors ligne

#50 Le 28/09/2011, à 07:46

cooljo

Re : [astuce]Pour éviter la galère de la reconnaissance de caractères (OCR)

bonjour,

j'ai trouvé ça
http://notesalexp.net/karmic/main/y/yagf/

cordialement


(nov-2017) Assus ROG GL553VD  Intel® Core™ i7-7700HQ 2.80 GHZ x4,  Mv 8Go, SSD 250Go Samsung S830 (ext 4), NVIDIA® GeForce® GTX™ 1050, Linux Mint 20.2, Cinnamon 64bits
Imprimante HP 3520
(oct-2021) Asus E410MA Vivobook Linux Mint 20.2 Cinnamon 64bits
'' L'instabilité est nécessaire pour progresser si on reste sur place, on recule. "

Hors ligne