Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#251 Le 02/08/2008, à 16:09

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

je viens d'essayer Xsane en mettant gocr -f UTF8 à la place de xsane2tess -l fra et ça marche déjà mieux.

Il est normal que "gocr -f UTF8 te permette d'obtenir un résultat...

Par contre, tu devrais obtenir quelque chose aussi (et normalement un résultat meilleur) avec xsane2tess -l fra. Il y a donc bien un problème à résoudre.

Vu ce que tu as installé (les différentes versions), l'origine du problème ne me saute pas aux yeux. Je vois trois pistes :

--> réessayer en mettant xsane2tess -l fra dans la configuration ocr de XSane...
... puis regarder le contenu du fichier /home/ton_identité/tmp/xsane2tess.log
(et copier-coller ce contenu ici)

--> pour plus de précision : comment as-tu installé xsane2tess ? par le deb de Guadausers ou bien "à la main" ?

--> as-tu bien installé aussi le paquet français (fra) de tesseract ?

Dernière modification par Sorbus (Le 02/08/2008, à 16:10)

Hors ligne

#252 Le 06/08/2008, à 22:43

hector

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

un petit nouveau (pas testé) : cuneiform

Hors ligne

#253 Le 20/08/2008, à 14:25

nuzolx

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

C'est imaginable de faire de la reconnaissance manuscrite sans "apprentissage" préalable ?


Ubutun 9.4 sur amd 64 X2 5000+, 7900gtx

Hors ligne

#254 Le 22/08/2008, à 21:03

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

De la reconnaissance manuscrite satisfaisante... c'est bien peu probable. On avait un peu causé de ça sur ce fil en mars dernier... et j'avais essayé de faire le point (voir ce message et les trois qui suivent).

Hors ligne

#255 Le 03/09/2008, à 16:50

Le Monolecte

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Bonjour à tous.

J'ai un peu errer à la recherche d'infos sur la ROC sous linux et ce n'est pas encore très probant. Surtout que j'aurais besoin d'extraire des textes de PDF et non d'un scan (récupération de notes de recherche and co numérisées en pdf et dont les originaux sont perdus, soit des pack de 50 à 200 pages en caractères standards - essentiellement arial et time new roman).
Il y a une solution possible ou faut-il encore attendre?


Debian 12 - Intel Nuc 11
Linux user 458639

Hors ligne

#256 Le 03/09/2008, à 22:49

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Bonsoir... En principe, pour une page PDF ou un document PDF, on obtient une ROC de qualité avec gscan2pdf + tesseract (à condition que la résolution soit suffisante... 300 ppi).

Par contre, j'ai un doute quant à la possibilité d'obtenir en un seul fichier le résultat de la ROC dans gscan2pdf... Et j'ai pour l'instant un bug avec la dernière version installée (0.9.26)... Mais fait l'essai en installant la version gscan2pdf des dépôts Hardy (0.9.21 de mémoire) et tesseract.

Il faut voir si pour des paquets de 50 à 200 pages, il n'y aurait pas une solution en ligne de commande avec convert + tesseract.

Mais essaye d'abord gscan2pdf + tesseract... et dis-nous...

Hors ligne

#257 Le 08/09/2008, à 16:03

zozo_serieux

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Hello,
j'ai essayé et approuvé tesseract (la version en .deb par b52 et pardon à tous ceux que j'oublie).
Sincèrement, je suis convaincu : j'utilisais à l'époque révolue depuis longtemps où j'étais sous zswxindowsz omnipage (10 je crois je ne suis plus sûr) livré avec mon scanner.
Le résultat était bien (je scannais des textes de 5-10 pages d'ouvages critiques pour mes étudiants), en mode texte simple avec la nécessité de corriger les fautes (les a, n, r, m notamment, les guillemets et la ponctuation) mais j'avais pris le coup de main.
Une fois passé à linux, j'ai capitulé devant la faiblesse de l'OCR disponible vers 2006.
Puis, j'ai honte mais j'ai euh... débridé vu**e*s*c*a**n qui s'est révélé bien fonctionner en ocr mais je n'étais pas satisfait de mon geste.
Je viens de découvrir tesseract et le résultat est vraiment probant avec de longs textes au registre très soutenu. Comme je formate avec latex la plupart du temps, c'est très facile à corriger et les alinéas ne sont pas gênants car non pris en compte par latex smile
Je l'ai adopté. J'estime à 5% d'erreur (je me trompe sûrement~; c'est certainement moins), et il apparaît très rapidement que les erreurs concernent le même type de lettres ou de signes diacritiques. Donc on prend vite le coup pour corriger des erreurs-types.
Je suis impressionné aussi par sa capacité à reconnaître les guillemets et les caractères accentués dans l'ensemble.

Me reste à trouver comment régler xsane pour le scan pour ne plus utiliser le logiciel cité ci-dessus, qui est vraiment performant pour le rendu en fonction du type de document original (mais comme il ne s'agit que de traitement logiciel, j'aimerais trouver qqch d'identique avec xsane : choix entre photo couleur, n&b, texte, revue, journal, texte, ce qui change vraiment le rendu en un tournemain.)
Je signale que j'ai scanné en mode "document texte" pour utiliser tesseract.

Pour moi qui ne cherche pas à reproduire automatiquement une mise en page, ce tesseract est parfait.
Voili!

Dernière modification par zozo_serieux (Le 08/09/2008, à 16:06)

Hors ligne

#258 Le 09/09/2008, à 13:28

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@zozo_serieux,

Merci pour ce retour d'expérience !
Et oui, nous devons à "b 52" un bon empaquetage (deb) de tesseract.

Comme je formate avec latex la plupart du temps, c'est très facile à corriger et les alinéas ne sont pas gênants car non pris en compte par latex...

Je n'ai pas essayé latex... ça m'intéresse de savoir comment tu procèdes... si tu peux : un petit mode d'emploi (à partir d'un document dont on a obtenu la ROC par tesseract).

il apparaît très rapidement que les erreurs concernent le même type de lettres ou de signes diacritiques.

Il y a des possibilités d'apprentissage pour tesseract... mais ça a l'air un peu compliqué... on n'a pas trop compris comment ça fonctionne... raison pour laquelle notre documentation Uubuntu sur Tesseract comporte encore un certain nombre de "FixMe" hmm

Me reste à trouver comment régler xsane pour le scan pour ne plus utiliser le logiciel cité ci-dessus, qui est vraiment performant pour le rendu en fonction du type de document original

C'est à dire... Pour l'instant, comment fais-tu ? Tu scanne le document avec le logiciel cité ci-dessus... Mais après, comment fais-tu pour utiliser tessercat ? En ligne de commande ? Ou bien en important le document scanné avec gscan2pdf ?

j'aimerais trouver qqch d'identique avec xsane : choix entre photo couleur, n&b, texte, revue, journal, texte, ce qui change vraiment le rendu en un tournemain.

Il sera difficile de trouver la même chose. Mais XSane permet bien déjà certains choix :
cf. les captures d'écran à cette page.

As-tu essayé la solution xsane+xsane2tess+tesseract ?

Sinon, il est aussi possible de scanner avec gscan2pdf, mais il me semble que ce logiciel offre pour l'instant moins de possibilités que XSane pour le scan... Il y a aussi Kooka, mais ce logiciel n'est plus développé je crois... et il ne permet pas pour l'instant d'effectuer directement de la ROC avec Tesseract...

Hors ligne

#259 Le 09/09/2008, à 22:23

zozo_serieux

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@Sorbus
>>Voici quelques réponses : je scanne avec le logiciel cité plus haut en tiff (ou tif je ne sais plus, en tout cas avec le bon nombre de "f" pour ne pas poser problème smile - j'ai lu la doc ubuntu smile
Ensuite j'utilise tesseract avec la ligne de commande (celle de la doc consacrée au package deb) ce qui me crée un fichier texte.
>>à propos de LaTeX, déjà qq mots. Je ne suis qu'un utilisateur lambda. Je me suis fait un gabarit que je modifie en fonction de mes textes. L'intérêt de LaTeX ici est qu'il ne tient pas compte de la mise en page du document texte créé.
Je m'explique: avec l'OCR on obtient des textes avec plein de fins de lignes au milieu de phrases. Avec OpenOffice, il faut les effacer et reconstituer le paragraphe, etc.
LaTeX voit un changement de ligne avec le signe "\\" et un changement de paragraphe avec un saut de ligne tout bêtement (il crée lui-même le nouvel aliné, le retrait en tête de paragraphe et même les césures de mots selon les règles françaises et les exceptions).
Alors, quand dans un fichier texte on se retrouve avec plein de lignes coupées, lui ne voit à chaque fois qu'un espace ("une" espace en typographie d'ailleurs).
très pratique.
C'est un traitement de texte à balisage, comme quand on crée une page html (ça y ressemble beaucoup en plus - ex) "il est \textbf{important} de noter cela" indique que le mot "important" doit être en gras. Etc.
J'ai découvert LaTeX avec des cours LaTeX gratuits mis en ligne (avec google c'est facile).

Une fois qu'on a une page type, on copie-colle son texte et on rajoute les balises pour la mise en page.
On passe à la moulinette d'un interpréteur (kile sous ubuntu) son fichier texte rebaptisé .tex et cela sort un fichier *.dvi imprimable, très léger, ou un *.pdf, plus lourd mais aisément échangeable avec autrui.
voilà smile

Hors ligne

#260 Le 10/09/2008, à 12:48

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@zozo_serieux,
L'utilisation de LaTeX dispense de la petite procédure décrite ici, nécessaire pour utiliser le résultat de la ROC sous Open Office. Merci pour les précisions.

Hors ligne

#261 Le 13/09/2008, à 11:55

hector

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

ocropus 0.2 a été empaqueté ! http://getdeb.net/app/Ocropus

j'ai un problème de dépendances, apparemment il faudrait utiliser leur tesseract et non celui de b52.
je ne suis pas allé plus loin...

Et pour cuneiform (qui est un ancien logiciel   windows  propriétaire  dont le code a été ouvert  et qui est en train d'être porté sous linux, la version actuelle ne gérant pas encore la mise en page -alors que la version windows, si-), j'ai pu compiler mais ai eu au lancement une erreur -pas trouvé de libpuma.so, alors que j'en ai bien un!-

donc chou blanc dans les 2 cas neutral

nb: je suis en train d'utiliser gscan2pdf, je lis dans la doc : Lorsque le travail de ROC est terminé, on peut copier/coller le texte de chaque page, une par une. Mais c'est un peu laborieux. On peut aussi FIXME

Qu'en est-il, ça m'aiderait drôlement (60 pages !!!)?
Merci

Dernière modification par hector (Le 13/09/2008, à 13:46)

Hors ligne

#262 Le 13/09/2008, à 22:59

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

"Lorsque le travail de ROC est terminé, on peut copier/coller le texte de chaque page, une par une. Mais c'est un peu laborieux. On peut aussi"

Ce petit ajout dans la documentation est de moi... Mais je n'ai pas trouvé la solution, hélas sad

J'ai placé cette phrase dans la doc pour souligner cette question... et pour que le premier qui trouve la solution puisse compléter...

une idée comme ça... nulle peut-être... fusionner les documents en un seul fichier avant de l'importer dans gscan2pdf (et donc avant de réaliser la ROC)... puis l'importer... puis ROC... est-ce que ça marcherait ? Je n'ai pas essayé d'importer un document de plusieurs pages pour tenter de réaliser la ROC d'un coup... Je ne sais pas si gscan2pdf le permet.

A défaut, réaliser la ROC en ligne de commande dans un script qui fusionnerait ensuite les fichiers de sortie en un seul...

Hors ligne

#263 Le 16/09/2008, à 10:00

zozo_serieux

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Hello,
comme je prépare un cours, voici de quoi partager ma petite expérience de tesseract et une mise en page simple (mais pas tout à fait basique) avec LaTeX.
Voici le texte scanné en choisissant le mode texte :
--- en jpg http://reparercharnierepc.free.fr/ubunt … cannee.jpg
--- converti en tif avec Gimp (c'est plus lourd : 3Mo): http://reparercharnierepc.free.fr/ubunt … cannee.tif
--- le fichier text en résultat avec tesseract et la commande suivante : "tesseract fichier.tif resultat -lwt fra"
N'oubliez pas de paramétrer Firefox avec affichage>encodage des caractères>unicode utf8. Sinon, tous les caractères accentués sont remplacés par de la bouillie illisible!
Ici : http://reparercharnierepc.free.fr/ubunt … sultat.txt
--- Après formatage avec gedit tout simplement, regardez à quoi ressemble le fichier latex. Il s'agit d'un simple fichier texte avec l'extension .tex (en utf-8 chez moi, ce qui est indiqué dans le document en outre). Pour les balises de mise en page, gedit propose dans affichage>mode de coloration>balisage>latex des couleurs pour les commandes, ce qui rend le tout plus lisible si besoin lors de la frappe et de la relecture.
Ne pas prendre peur : une fois que l'on a son canevas de document, on commente et décommente en fonction des besoins, et on ne change plus que le corps du texte et le contenu des titres, en-têtes etc.
ici : http://reparercharnierepc.free.fr/ubunt … _forum.tex
Ouvez-le à l'aide de gedit.
--- passage à la moulinette du logiciel kile et sortie d'un dvi :
http://reparercharnierepc.free.fr/ubunt … _forum.dvi
--- ou d'un pdf : http://reparercharnierepc.free.fr/ubunt … _forum.pdf

Donc, pour répéter mon post précédent :
--- Avec LaTeX, pas de problème de mise en page avec les fins de ligne : une fin de ligne=1espace donc cela va au mot suivant tout simplement.
---Tesseract donne à mes yeux d'excellents résultats : regardez, il n'y a quasiment aucune erreur :
           * les lettres parasites sont les numéros de lignes si petits qu'ils sont mal reconnus et dont on n'a que faire et l'appel de note de bas de page après "Galilée". À effacer!
           * les tirets de césure sont à effacer
           * le tiret dans "nous-mêmes" avant-dernier paragraphe est faux (tesseract a fait un demi-cadratin or il faut un tiret simple)
           * espace à l'intérieur des parenthèses à effacer
           * il y a un "E" à la place d'un "e" sur l'une des dates
           * quelques taches devenues des "`" et un point à droite du document.
De mémoire, c'est tout. Je trouve que les erreurs sont totalement négligeables et qu'elles font partie des petites corrections lors d'un OCR.
Je n'ai jamais eu d'aussi bons résultats.
En espérant que cela vous aura un peu éclairé.

PS : un petit erratum de rien du tout. La version dvi ou pdf devrait avoir la référence finale en gras mais je me suis trompé de fichier. Ça ne change pas grand chose.

Dernière modification par zozo_serieux (Le 16/09/2008, à 10:09)

Hors ligne

#264 Le 28/09/2008, à 16:32

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@zozo_sérieux,
Merci pour ce partage d'expérience.

@hector,
Je n'ai pas beaucoup de temps ces jours. Merci pour cette nouvelle, qui a son importance :

ocropus 0.2 a été empaqueté ! http://getdeb.net/app/Ocropus
j'ai un problème de dépendances, apparemment il faudrait utiliser leur tesseract et non celui de b52. je ne suis pas allé plus loin...

Je vais essayer d'essayer ;-)

Hors ligne

#265 Le 18/10/2008, à 17:30

Zococo

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Bonjour,

des appareils tel que le ZPen ou le Digimemo semblent permettre de transférer des notes manuscrites sur PC mais il faut ensuite les passer en reconnaissance d'écriture via un logiciel comme MyScript Notes qui semble pouvoir lire l'écriture manuscrite. Mais ce logiciel ne tourne que sous W*.

Au vu des quelques posts consacrés à la reconnaissance d'écriture manuscrite dans le fil de discussion, je constate que c'est un exercice difficile sous Linux.

Est-ce que quelqu'un aurait testé MyScript Notes sous Wine et pourrait faire part de son expérience ?

Par avance merci.


Ubuntu 23.04 (64 bits) - Gigabyte B250M-DS3H / Core i5-7600K (Kaby lake) - Microsoft surface Go 3

Hors ligne

#266 Le 19/10/2008, à 10:08

zozo_serieux

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@Zococo
Désolé, je ne connais pas (je ne savais même pas que ça existait sad  )

Dernière modification par zozo_serieux (Le 19/10/2008, à 10:08)

Hors ligne

#267 Le 19/10/2008, à 13:53

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Moi non plus. As-tu essayé sous Windows ? Ça donne un résultat correct au point de pouvoir présenter un réel intérêt ?
C'est ... pour un essai de 30 jours... puis environ 60 euros pour qui veut l'acheter.

Il faudrait vraiment que ce soit parfait pour que ça en vaille la peine... Et il faudrait en plus que ça fonctionne correctement avec wine. Bien qu'étant curieux de voir le résultat, je ne pense pas essayer... Sur la liste d'attente des tests, j'ai d'abord Ocropus.

Mais si quelqu'un peut nous donner une idée non publicitaire (c'est à dire conforme à la réalité) de ce que peut produire ce type de logiciel, ce serait intéressant.

Hors ligne

#268 Le 19/10/2008, à 16:50

phira

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

je lis un peu tardivement ce fil.
j'avais lu la page de doc avant et fait des tests.
juste pour vous dire que j'ai eu un rendu comparatif (même page à scanner) etonnement bon (98% de reconnaissance) avec la configuration suivante:
ubuntu 7.10
gimp et xsane: 300dpi en trait (pas en niveau de gris)
sauvegarde en TIF sans compression
logiciel de scan: simpleOCR sous wine

j'ai donc une solution stable, mais je vais tenter ce que vous avez développés ici

merci à tous

Dernière modification par phira (Le 19/10/2008, à 16:50)


sous ubuntu depuis 2006, je n'en reviens pas!

Hors ligne

#269 Le 22/10/2008, à 16:12

Zococo

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@tous : merci de vos retours.
Je pense que je vais essayer de tester le logiciel ci-dessus après le 15/11, je vous rendrai compte de mon expérience, en attendant une version libre et linux d'ICR...


Ubuntu 23.04 (64 bits) - Gigabyte B250M-DS3H / Core i5-7600K (Kaby lake) - Microsoft surface Go 3

Hors ligne

#270 Le 25/11/2008, à 21:50

hector

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Bonsoir,
ocropus a sorti (depuis 1 mois) la version 0.3.1 ....

Hors ligne

#271 Le 30/11/2008, à 23:03

fra_tor_33

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

bonsoir,
j'utilisais tesseract + xsane2tess sous hardy et je n'avais aucun problème.
Depuis que j'ai fait une réinstallation complète sous intrepid, ça ne fonctionne plus.
J'ai xsane 0.995
tesseract 2.03.3
xsane2tess 1.0-1 de guadalinex

J'ai lu et relu ce fil en   installant et désinstallant plusieurs fois les paquets concernés mais toujours pareil.

Dans le fichier log de xsane2tess, j'ai ceci :

Tesseract Open Source OCR Engine
     modif command line by b52
     imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
    -l   = Lang Without Tiff
    -lwt = Lang With Tiff

Tesseract Open Source OCR Engine
IMAGE::read_header:Error:Can't open file:/home/frator/tmp/.tif
tesseract:Error:Read of file failed:/home/frator/tmp/.tif
Signal_exit 31 ABORT. LocCode: 3  AbortCode: 3
cat: /home/frator/tmp/.txt: Aucun fichier ou dossier de ce type
rm: ne peut enlever `/home/frator/tmp/.tif': Aucun fichier ou dossier de ce type
rm: ne peut enlever `/home/frator/tmp/.txt': Aucun fichier ou dossier de ce type

Le fichier out.txt produit est vide à chaque fois et visiblement, l'OCR ne fonctionne pas car le fichier s'affiche et peut s'ouvrir immédiatement...

Quelqu'un peut-il m'aider ? merci

Hors ligne

#272 Le 04/12/2008, à 22:50

Sorbus

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@fra_tor_33

Excuse, je ne vois ton message que ce soir. Je vais essayer de t'aider. Mais il faut que j'ai un peu le temps de réfléchir à la question. Mon fixe est encore sous Hardy... et je ne peux tester xsane+xsane2tess+tesseract qu'avec celui-ci... Mon portable est sous Intrepid, mais je ne peux tester, car mon vieux scanneur n'est pas en usb. Mais j'essaye de me replonger dans ces questions dès que possible pour tenter de t'apporter des réponses.

La partie intéressante de ton message d'erreur est celle-ci :

Tesseract Open Source OCR Engine
IMAGE::read_header:Error:Can't open file:/home/frator/tmp/.tif
tesseract:Error:Read of file failed:/home/frator/tmp/.tif
Signal_exit 31 ABORT. LocCode: 3  AbortCode: 3

Ce qui est avant est normal. Ce qui est après n'est que la conséquence de l'erreur.

De mémoire, une piste à chercher du côté de la seconde version (1.1 je crois) d'xsane2tess (des utilisateurs de Mandriva avaient un problème avec xsane2tess 1.0... peut-être avons nous le même problème sous Intrepid ?).

Ton message d'erreur ressemble en effet beaucoup à celui-ci

Il serait intéressant de savoir si, parmi ceux qui lisent les messages de ce fil, certains utilisent la solution "xsane+xsane2tess+tesseract" sans difficulté sous Intrepid... ou bien si le problème est général.

xsane2tess 1.1 n'est pas empaqueté en deb. Mais on peut l'installer "à la main" comme indiqué dans la doc Ubuntu sur xsane2tess (en remplaçant le script de la version 1.0 de la doc par le script de la version 1.1 que tu trouveras ici (xsane2tess version1.1)

Tu peux tester : le script à insérer commence par la ligne :
#!/bin/bash

Hors ligne

#273 Le 04/12/2008, à 23:27

fra_tor_33

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

ok,  merci pour ta réponse. Je teste dès que possible et je te tiens au courant.
Je suppose qu'il faut que j'enlève l'ancienne version de tesseract avant ?

Ne sois pas désolé de ne pas avoir répondu plus tôt. C'est déjà très sympa d'essayer de m'apporter une solution. C'est ce que j'apprécie beaucoup sur ce forum. Malgré un certain nombre de petits soucis, je n'ai nullement l'intention d'abandonner ubuntu que j'ai découvert il y a quelques mois seulement !!
Merci pour ton aide...

Hors ligne

#274 Le 05/12/2008, à 09:02

Bushman02

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

@ Sorbus (suite à sa demande ci-dessus), pour contribuer à la discussion.
Je confirme le problème rencontré par fra_tor_33 sous Ibex : même configuration Xsane 0.995/Tesseract 2.03.3 et utilisation du script de la doc Ubuntu pour xsanes2tess. Je ne peux donner le message d'erreur (ayant abandonné Ibex), mais insuccès total.
-- Tout continue à fonstionner parfaitement sous Gutsy, même après une réinstallation via remastersys !
Merci encore à Sorbus et aux autres habitués de ce fil.

Hors ligne

#275 Le 05/12/2008, à 09:28

fra_tor_33

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Bonjour,

Je viens de tester la solution qui consiste à remplacer xsane2tess 1.0 par la version 1.1 en suivant la procédure indiquée par scorbus et en suivant la doc xsane2tess d'ubuntu.fr. pour créer un script en manuel.

Malheureusement, je n'ai observé aucun changement. Le fichier texte qui est généré est désespérément vide. Autant dire que si je fais un scan avec le format .tiff ou jpeg ou autre et non le type .text, un fichier est bien créé mais au format Tiff, ou jpeg ou autre, non traité donc par tesseract.

Il serait en effet intéressant de savoir si d'autres utilisateurs de la 8.10 rencontrent le même problème.
Merci à tous les contributeurs.

Hors ligne