Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Sorbus · Le 29/06/2008, à 23:21

@Bushman02
Pas de scanneur là où je suis avec mon portable; je ne peux donc pas tester XSane d'ici 2 jours...
Mais pour essayer de déterminer la cause :

--> As-tu repéré depuis quel date xsane2tess ne fonctionne plus ? Est-ce que ça correspond à une mise à jour (si oui, de quel paquet) ?
[commande pour avoir sur ton bureau un fichier contenant l'historique des mises à jour, installations et désinstallations :
zgrep -h " installed \| upgrade \| remove " /var/log/dpkg.log* | sort | uniq > ~/Desktop/historique.txt]

--> A quoi as-tu repéré que xsane2tess ne fonctionne plus. Que ça passe-t-il exactement quand tu lances un scan avec ROC ? A quel moment ça ne marche pas comme il faudrait ?

--> Tu n'as pas modifié la configuration de la ROC dans XSane ?

--> Lances XSane via un terminal :

xsane

Essaye de lancer à nouveau un scan avec ROC. Puis envoie-nous le contenu du terminal.

Bushman02 · Le 30/06/2008, à 09:39

Merci, Sorbus, de ton attention.
J'essaie d'être bref :

Configuration :
Pour ce qui est de xsane / préférences / configuration, je suis très strictement les conseils du tutoriel de la documentation.

Symptômes :
- que je lance xsane en mode graphique ou en ligne de commande, le fichier txt qui s'affiche en sortie est vierge : aucune reconnaissance, donc.
- seule différence : en mode graphique, le fichier txt est immédiatement enregistré, en utilisant le terminal, il n'arrive pas à s'enregistrer et je suis obligé de fermer pour en finir avec la manœuvre !

Problèmes éventuels avec de nouveaux paquets :
Seule nouveauté notable ces derniers temps : mon kernel était jusque-là le 2.6.22.14 et, depuis la semaine dernière, à la suite d'une m. à j., j'ai aussi le 2.6.22.15... J'ai essayé avec les deux : mêmes symptômes.
Je n'ai pas, non plus, installé de nouveau logiciel depuis un certain temps.

Voici le contenu du terminal lorsque je lance xsane depuis la ligne de commande :
jlc@jlc-laptop:~$ xsane
/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambigûe

Quant à xsane2tess.log, contenu dans tmp, il affiche :
Tesseract Open Source OCR Engine
modif command line by b52
imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
-l = Lang Without Tiff
-lwt = Lang With Tiff

Unable to load unicharset file /usr/share/tessdata/wt.unicharset
cat: /home/jlc/tmp/.txt: Aucun fichier ou répertoire de ce type
rm: ne peut enlever `/home/jlc/tmp/.tif': Aucun fichier ou répertoire de ce type
rm: ne peut enlever `/home/jlc/tmp/.txt': Aucun fichier ou répertoire de ce type

Voilà.
Merci encore... mais ne perds pas trop de temps avec moi : gscan2pdf peut parfaitement suffire à mes besoins.

Sorbus · Le 30/06/2008, à 10:36

/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambigûe

Ça... ça me dit quelque chose... J'ai déjà vu. Mais je ne me souviens plus... Comme je ne peux pas tester, je n'aurai une réponse sûre que demain. A tout hasard :
Dans XSane, quel chemin est indiqué pour le fichier de sortie ?

Unable to load unicharset file /usr/share/tessdata/wt.unicharset

Ah... Là c'est autre chose.

Dans la configuration OCR de XSane, tu as bien mis :
Commande OCR : xsane2tess -l fra
et non pas :
Commande OCR : xsane2tess -lwt fra

?

Dernière modification par Sorbus (Le 30/06/2008, à 10:36)

Bushman02 · Le 30/06/2008, à 14:25

Réponses :

Le chemin indiqué pour le fichier de sortie est -o

J'utilise bien la commande préconisée par le tutoriel de la documentation...

Merci de ta rapidité... mais rien ne presse !

Sorbus · Le 30/06/2008, à 17:15

"Merci encore... mais ne perds pas trop de temps avec moi : gscan2pdf peut parfaitement suffire à mes besoins."
"Merci de ta rapidité... mais rien ne presse !"

Si tu as ce problème, il a pu ou pourra arriver à d'autres. Quand un bogue est signalé, trouver son origine peut rendre service à plusieurs...

Pour l'instant, je note seulement que le retour que tu as dans xsane2tess.log :
("Unable to load unicharset file /usr/share/tessdata/wt.unicharset")

signifie que tesseract ne trouve pas le fichier de langue "wt"...
(ce qui est normal, puisqu'il n'existe pas de fichier de langue "wt")
... comme si la commande lancée était :

tesseract   -l   wt

au lieu de :

tesseract   -l   fra

Voici par exemple le retour que j'obtiens si je lance en ligne de commande :

$ tesseract TEST.tif RESULTL   -l   wt

Tesseract Open Source OCR Engine
	 modif command line by b52
	 imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
	-l   = Lang Without Tiff
	-lwt = Lang With Tiff

Unable to load unicharset file /usr/share/tessdata/wt.unicharset

Si la commande indiquée dans la configuration ROC de XSane est bien :
tesseract -l fra
... le retour que tu obtiens dans xsane2tess.log est étonnant.

Le chemin indiqué pour le fichier de sortie est -o

OK... mais je parle du chemin qui est indiqué dans la fenêtre principale de XSane, dans la zone située à côté de l'icône "disquette".

Dernière modification par Sorbus (Le 30/06/2008, à 17:18)

Bushman02 · Le 30/06/2008, à 21:52

Lancé la même ligne de commandez que toi. J'obtiens, en effet :

Tesseract Open Source OCR Engine
         modif command line by b52
         imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
        -l   = Lang Without Tiff
        -lwt = Lang With Tiff

Unable to load unicharset file /usr/share/tessdata/wt.unicharset

Pour ce qui est du chemin de sortie de la fenêtre principale de xsane, c'est le chemin habituel : out.text, out2.text ou toto.text, selon les besoins.

La commande indiquée dans la configuration Roc de Xsane est bien xsane2tess -l fra. J'ai essayé avec tesseract -l fra : même résultat.

Ce qui est étrange c'est que tout fonctionnait parfaitement jusque-là.
Merci encore...

Dernière modification par Bushman02 (Le 30/06/2008, à 21:55)

Sorbus · Le 30/06/2008, à 22:01

"xsane2tess -l fra. J'ai essayé avec tesseract -l fra"

Excuse-moi.
La bonne commande dans XSane est bien :
xsane2tess -l fra
comme indiqué dans la doc.

Mais ça bogue...

Bien... je testerai demain...
A suivre...

Bushman02 · Le 30/06/2008, à 22:29

Sorbus,

Comme je dois m'absenter demain pour la journée, j'ai opté pour la solution radicale, c'est-à-dire sudo apt-get remove xsane, ce qui a eu pour effet de désinstaller, du même coup, xsane2tess.
J'ai réinstallé xsane en ligne de commande et xsane2tess à partir du script de la documentation.
Résultat : le premier essai a été le bon et le second n'a fait que confirmer le premier.
Peut-être y a-t-il un petit problème de compatibilité entre certains paquets ? Je ne suis pas assez technicien pour le dire, loin de là.
Merci, en tout cas de ton aide.

Dernière modification par Bushman02 (Le 30/06/2008, à 22:43)

Sorbus · Le 01/07/2008, à 10:39

@Bushman02,

Tu as bien fait de choisir cette solution. Une paille "wt" avait du se mettre en travers chez toi. Je ne comprends pas pour l'instant ni pourquoi ni comment.

J'ai testé ce matin. Pour "obtenir" le bogue, avec le même résultat que toi dans le terminal et dans le fichier xsane2tess.log, je lance xsane via le terminal. Et je configure XSane :
Préférences -> Configuration -> Onglet OCR -> Commande OCR : xsane2tess -l wt fra

Résultat dans le terminal :
/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambigûe

Résultat dans xsane2tess.log :

Tesseract Open Source OCR Engine
modif command line by b52
imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
-l = Lang Without Tiff
-lwt = Lang With Tiff
Unable to load unicharset file /usr/share/tessdata/wt.unicharset
cat: /home/sorbus/tmp/.txt: Aucun fichier ou dossier de ce type
rm: ne peut enlever `/home/sorbus/tmp/.tif': Aucun fichier ou dossier de ce type
rm: ne peut enlever `/home/sorbus/tmp/.txt': Aucun fichier ou dossier de ce type

Puisque chez toi, xsane était configuré avec :
xsane2tess -l fra
et non pas
xsane2tess -l wt fra
... le "wt" s'est ajouté de façon inopinée à un moment du processus.

Peut-être y a-t-il un petit problème de compatibilité entre certains paquets ?

le "wt" ajouté semblerait avoir un rapport avec l'option "lwt" propre au paquet tesseract de "b52", mais je ne vois vraiment pas comment les deux ont pu interférer. Je vais poser la question à "b52" au cas où il ait une idée.

Et comme c'est résolu chez toi, ce petit bogue étant mémorisé sur ce fil, on en reste là. Si personne d'autre ne signale ce problème dans les semaines qui viennent, cela voudra dire qu'il est très marginal. Si d'autres le signalent, on cherchera plus loin.

Merci et @+

Bushman02 · Le 02/07/2008, à 09:14

Merci pour tout !

Leonux · Le 13/07/2008, à 16:23

Salut à tous

Regardez si ce tuto peut amener une pierre à l'édifice :

http://ubunteros.tuxfamily.org/spip.php?article184

Le résultat est bon chez moi, voyons si c'est productible

Sorbus · Le 13/07/2008, à 17:26

Salut Leonux,

Ocrad... Le retour !
Je suis un peu surpris et sceptique... Mais je vais bien sûr essayer.
J'en étais resté là.

A noter - par rapport à ton tuto - qu'avec XSane, on peut arriver encore plus directement au fichier texte sans passer par la visionneuse (quel que soit le moteur de ROC utilisé), en sélectionnant directement dans XSane :
- "enregistrer" au lieu de "visionneuse",
- le format TEXT (au lieu de PNM).

Mais je vais essayer les deux. A tout d'suite.

Dernière modification par Sorbus (Le 13/07/2008, à 17:32)

Leonux · Le 13/07/2008, à 17:43

Salut Sorbus,

A priori, après avoir navigué sur internet et testé sur ma machine, passer par le format pnm donne de meilleurs résultats ..

regarde dans le forum de l'article, j'ai fait un comparatif entre tesseract et ocrad sur un même texte ...

J'ai tenté d'intégrer ocrad et tesseract dans l'onglet OCR de Xsane. Après avoir essayé plusieurs possibilités, Ocrad est beaucoup plus à l'aise dans cette interface graphique ..

Comme je le précise, dans les deux cas, j'ai du passer par un éditeur pour modifier l'encodage avant de faire un copier/coller vers OpenOffice ..

Sorbus · Le 13/07/2008, à 18:05

Je vois... Mais pour l'instant, d'une part, je n'arrive rien à sortir avec XSane+ocrad, y compris en passant par l'intermédiaire de la visionneuse et d'un format PNM (ocrad est bien installé, et j'obtiens quelque chose de pas mal avec Kooka+ocrad, mais moins bon que tesseract). D'autre part, je n'ai pas besoin de rectifier l'encodage avec XSane+xsane2tess+tesseract.

Y'a un mystère.

Dernière modification par Sorbus (Le 13/07/2008, à 18:13)

Sorbus · Le 13/07/2008, à 19:03

Pour toute comparaison utile :
- je suis sous Ubuntu Hardy (8.04) (Gnome)
- xsane 0.995-1Ubuntu1
- ocrad 0.17-2
- tesseract 2.03 installé via le paquet de b52

Et toi Leonux ?

Leonux · Le 13/07/2008, à 19:26

J'ai fait mon essai sous Open Suse 11 avec un KDE4 embarqué

- xsane 0.995-79.1-i586
- ocrad 0.17-43.1-586
- tesseract 2.01-5.2-586

Le tout est en paquets .rpm, bien sûr

Sorbus · Le 13/07/2008, à 20:48

Il serait donc intéressant que d'autres puissent tester ta proposition sous Ubuntu pour voir s'ils ont le même problème que moi... A suivre...

Leonux · Le 13/07/2008, à 22:38

Ouaip ! Je vais sans doute commencer, j'ai une Ubuntu sur un autre ordi, il côtoie une Zenwalk..

Si je suis bien avancé dans le bricolage que je dois faire, j'essayerais demain sur ces deux distribs... ça me démange cette affaire

Bushman02 · Le 13/07/2008, à 23:27

Peu technicien, j'ai essayé avec mon matériel et avec ses limites (scanner Canon Lide-30, Xsane 0.991, ocrad 0.16 et le tesseract de B52) : je n'ai rien obtenu, sinon des fichiers vides... malgré de nombreux essais avec divers réglages.
J'ai tenté la même chose avec Kooka pour un résultat voisin : texte illisible.
... Je suis vite revenu à xsane2tess... et j'ai vérifié qu'il marchait toujours parfaitement - à peu de chose près !
-- Bien entendu, auparavant, j'avais lu les posts de leonux. J'ai donc suivi son tuto, et j'ai surtout constaté que les résultats qu'il obtient sont similaires à ce que l'on peut obtenir grâce à tesseract (même si xsane2tess me semble d'un usage plus rapide que xsane + ocrad).

Conclusion : l'intérêt de Linux, c'est d'offrir différentes solutions selon le matériel utilisé. Encore faut-il être aidé dans ses choix... mais ce fil de discussion est en cela exemplaire.
J'espère y avoir participé positivement.

Leonux · Le 14/07/2008, à 07:13

Salut Bushman02

Conclusion : l'intérêt de Linux, c'est d'offrir différentes solutions selon le matériel utilisé. Encore faut-il être aidé dans ses choix... mais ce fil de discussion est en cela exemplaire.

Je partage sans aucune restriction ton point de vue. C'est, en effet, un point fort de GNU Linux : permettre de personnaliser son usage de l'ordi en fonction de son matériel et de ses goûts..

J'espère y avoir participé positivement.

Sans aucun doute, merci Bushman02, pour tes contributions et pour ton excellent état d'esprit.

Sorbus · Le 14/07/2008, à 14:00

Oui, merci Bushmann02,

Ton essai xsane+ocrad confirme le mien : quand je disais que je n'obtenais rien, en fait, c'est exactement comme toi, le fichier de sortie est bien créé, mais il est vide.
Je vois que ta version de XSane est la 0.991, tu es sous Ubuntu Gutsy ?

@ Leonux,
Est-ce que tu as pu tester toi aussi sous Ubuntu ?
Si c'est une question de version des paquets XSane et ocrad, je vois qu'il y a dans les dépôts Ubuntu des versions légèrement plus récentes :
ocrad_0.17-3
xsane_0.996-3ubuntu2

J'essayerai avec ça dès que je pourrai.

Mais quelle que soit la version, je me demande où xsane (empaqueté pour Ubuntu) va chercher ocrad... est-ce que ce n'est pas une bête question de chemin ? J'ai essayé de lancer xsane par le terminal, mais il ne donne aucune indication... et je ne sais pas trop où trouver les fichiers de log si une trace de cet "échec" est laissée quelque part.

Dernière modification par Sorbus (Le 14/07/2008, à 14:01)

Leonux · Le 14/07/2008, à 18:30

Salut Sorbus,

Mais quelle que soit la version, je me demande où xsane (empaqueté pour Ubuntu) va chercher ocrad

Il te faut modifier un peu la conf de xsane. Par défaut, xsane va aller chercher gocr ..

J'ai donc remplacé gocr par ocrad, on peut aussi lui donner ce chemin /usr/bin/ocrad, ce qui revient au même

Tu as vu, je t'ai mis un message sur l'autre forum

Est-ce que tu as pu tester toi aussi sous Ubuntu ?

Pas encore, une belle journée ensoleillée en Normandie m'a incité à foncer au jardin.. Taille de haies, désherbage et tout le toutim, un vrai bonheur

kimort · Le 28/07/2008, à 22:15

Bonjour
J'ai un petit blême? Peut on m'aider?

en console:
dupont@linux07:~$ xsane2tess -i
/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambiguë

avec kooka et gocr la page est vide
avec ocrad

Marieíniu
 Duont Caull
  avenu Nare Dame
 ooo Bourg ant andéol
 tt oq  6 g


 Bowg ant andol m  ullt 008



 ot: demnde de remauPement d'un ow e centre  oíír





 honíur,



 ut á un changemn d lnon fnloí u m m nfant, Denís t {fhr

 Dupon, íncrt u ntr e loír l luní g uíllet, n ouront pa y aler

 C't pouuaí e m permeto  vou emaRr | rmaouremnt mme paRíl e

 leuroum n fte n'aí aucun aîa, n  | arh n da comía d'entrepríe

 our payr l centre d loíîr




 Vulle agréer f2oníeur In meÍlleure alutatíon

Xscane (donc Gocr) il se passe rien.

Merci!

Dernière modification par kimort (Le 29/07/2008, à 10:35)

Sorbus · Le 31/07/2008, à 11:37

Salut kimort,

xsane2tess est un adaptateur tesseract pour XSane... Essaye d'utiliser xsane2tess dans XSane plutôt qu'en console, comme indiqué ici.

Peux-tu donner quelques précisions pour qu'on puisse t'aider plus facilement :

Quel est ton système d'exploitation (Linux Ubuntu Hardy ? Linux Mandriva (version ?) ? Autre ?)
As-tu installé tesseract (quelle version, par quel moyen ?)
Quelles versions de XSane, gocr, ocrad, kooka, sont installées sur ton système ?

kimort · Le 02/08/2008, à 16:43

Bonjour
Merci de te proposer pour m'aider.
J'avais déjà fait le tuto pour se servir de Xsane2tess avec XScane mais il ne se passe rien quand je lui demande le mode texte.

Par contre je viens d'essayer Xsane en mettant gocr -f UTF8 à la place de xsane2tess -l fra et ça marche déjà mieux.

Tesseract est installé grâce aux paquets.
J'utilise Ubuntu Hardy.
Mes versions de programme sont:
Xsane 0.995 (la dernière)
Gocr 0.41 (la dernière)
ocrad 0.17-2 (la dernière)
kooka 4:3.59 (la dernière)

Voila merci

Dernière modification par kimort (Le 02/08/2008, à 16:50)

Ubuntu-fr

Navigation

Liens de recherche

Annonce

#226 Le 29/06/2008, à 23:21

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#227 Le 30/06/2008, à 09:39

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#228 Le 30/06/2008, à 10:36

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#229 Le 30/06/2008, à 14:25

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#230 Le 30/06/2008, à 17:15

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#231 Le 30/06/2008, à 21:52

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#232 Le 30/06/2008, à 22:01

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#233 Le 30/06/2008, à 22:29

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#234 Le 01/07/2008, à 10:39

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#235 Le 02/07/2008, à 09:14

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#236 Le 13/07/2008, à 16:23

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#237 Le 13/07/2008, à 17:26

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#238 Le 13/07/2008, à 17:43

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#239 Le 13/07/2008, à 18:05

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#240 Le 13/07/2008, à 19:03

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#241 Le 13/07/2008, à 19:26

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#242 Le 13/07/2008, à 20:48

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#243 Le 13/07/2008, à 22:38

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#244 Le 13/07/2008, à 23:27

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#245 Le 14/07/2008, à 07:13

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#246 Le 14/07/2008, à 14:00

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#247 Le 14/07/2008, à 18:30

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#248 Le 28/07/2008, à 22:15

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#249 Le 31/07/2008, à 11:37

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

#250 Le 02/08/2008, à 16:43

Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...

Pied de page des forums