#226 Le 29/06/2008, à 22:21
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
@Bushman02
Pas de scanneur là où je suis avec mon portable; je ne peux donc pas tester XSane d'ici 2 jours...
Mais pour essayer de déterminer la cause :
--> As-tu repéré depuis quel date xsane2tess ne fonctionne plus ? Est-ce que ça correspond à une mise à jour (si oui, de quel paquet) ?
[commande pour avoir sur ton bureau un fichier contenant l'historique des mises à jour, installations et désinstallations :
zgrep -h " installed \| upgrade \| remove " /var/log/dpkg.log* | sort | uniq > ~/Desktop/historique.txt]
--> A quoi as-tu repéré que xsane2tess ne fonctionne plus. Que ça passe-t-il exactement quand tu lances un scan avec ROC ? A quel moment ça ne marche pas comme il faudrait ?
--> Tu n'as pas modifié la configuration de la ROC dans XSane ?
--> Lances XSane via un terminal :
xsane
Essaye de lancer à nouveau un scan avec ROC. Puis envoie-nous le contenu du terminal.
Hors ligne
#227 Le 30/06/2008, à 08:39
- Bushman02
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Merci, Sorbus, de ton attention.
J'essaie d'être bref :
Configuration :
Pour ce qui est de xsane / préférences / configuration, je suis très strictement les conseils du tutoriel de la documentation.
Symptômes :
- que je lance xsane en mode graphique ou en ligne de commande, le fichier txt qui s'affiche en sortie est vierge : aucune reconnaissance, donc.
- seule différence : en mode graphique, le fichier txt est immédiatement enregistré, en utilisant le terminal, il n'arrive pas à s'enregistrer et je suis obligé de fermer pour en finir avec la manœuvre !
Problèmes éventuels avec de nouveaux paquets :
Seule nouveauté notable ces derniers temps : mon kernel était jusque-là le 2.6.22.14 et, depuis la semaine dernière, à la suite d'une m. à j., j'ai aussi le 2.6.22.15... J'ai essayé avec les deux : mêmes symptômes.
Je n'ai pas, non plus, installé de nouveau logiciel depuis un certain temps.
Voici le contenu du terminal lorsque je lance xsane depuis la ligne de commande :
jlc@jlc-laptop:~$ xsane
/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambigûe
Quant à xsane2tess.log, contenu dans tmp, il affiche :
Tesseract Open Source OCR Engine
modif command line by b52
imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
-l = Lang Without Tiff
-lwt = Lang With Tiff
Unable to load unicharset file /usr/share/tessdata/wt.unicharset
cat: /home/jlc/tmp/.txt: Aucun fichier ou répertoire de ce type
rm: ne peut enlever `/home/jlc/tmp/.tif': Aucun fichier ou répertoire de ce type
rm: ne peut enlever `/home/jlc/tmp/.txt': Aucun fichier ou répertoire de ce type
Voilà.
Merci encore... mais ne perds pas trop de temps avec moi : gscan2pdf peut parfaitement suffire à mes besoins.
Hors ligne
#228 Le 30/06/2008, à 09:36
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambigûe
Ça... ça me dit quelque chose... J'ai déjà vu. Mais je ne me souviens plus... Comme je ne peux pas tester, je n'aurai une réponse sûre que demain. A tout hasard :
Dans XSane, quel chemin est indiqué pour le fichier de sortie ?
Unable to load unicharset file /usr/share/tessdata/wt.unicharset
Ah... Là c'est autre chose.
Dans la configuration OCR de XSane, tu as bien mis :
Commande OCR : xsane2tess -l fra
et non pas :
Commande OCR : xsane2tess -lwt fra
?
Dernière modification par Sorbus (Le 30/06/2008, à 09:36)
Hors ligne
#229 Le 30/06/2008, à 13:25
- Bushman02
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Réponses :
Le chemin indiqué pour le fichier de sortie est -o
J'utilise bien la commande préconisée par le tutoriel de la documentation...
Merci de ta rapidité... mais rien ne presse !
Hors ligne
#230 Le 30/06/2008, à 16:15
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
"Merci encore... mais ne perds pas trop de temps avec moi : gscan2pdf peut parfaitement suffire à mes besoins."
"Merci de ta rapidité... mais rien ne presse !"
Si tu as ce problème, il a pu ou pourra arriver à d'autres. Quand un bogue est signalé, trouver son origine peut rendre service à plusieurs...
Pour l'instant, je note seulement que le retour que tu as dans xsane2tess.log :
("Unable to load unicharset file /usr/share/tessdata/wt.unicharset")
signifie que tesseract ne trouve pas le fichier de langue "wt"...
(ce qui est normal, puisqu'il n'existe pas de fichier de langue "wt")
... comme si la commande lancée était :
tesseract -l wt
au lieu de :
tesseract -l fra
Voici par exemple le retour que j'obtiens si je lance en ligne de commande :
$ tesseract TEST.tif RESULTL -l wt
Tesseract Open Source OCR Engine
modif command line by b52
imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
-l = Lang Without Tiff
-lwt = Lang With Tiff
Unable to load unicharset file /usr/share/tessdata/wt.unicharset
Si la commande indiquée dans la configuration ROC de XSane est bien :
tesseract -l fra
... le retour que tu obtiens dans xsane2tess.log est étonnant.
Le chemin indiqué pour le fichier de sortie est -o
OK... mais je parle du chemin qui est indiqué dans la fenêtre principale de XSane, dans la zone située à côté de l'icône "disquette".
Dernière modification par Sorbus (Le 30/06/2008, à 16:18)
Hors ligne
#231 Le 30/06/2008, à 20:52
- Bushman02
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Lancé la même ligne de commandez que toi. J'obtiens, en effet :
Tesseract Open Source OCR Engine
modif command line by b52
imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
-l = Lang Without Tiff
-lwt = Lang With Tiff
Unable to load unicharset file /usr/share/tessdata/wt.unicharset
Pour ce qui est du chemin de sortie de la fenêtre principale de xsane, c'est le chemin habituel : out.text, out2.text ou toto.text, selon les besoins.
La commande indiquée dans la configuration Roc de Xsane est bien xsane2tess -l fra. J'ai essayé avec tesseract -l fra : même résultat.
Ce qui est étrange c'est que tout fonctionnait parfaitement jusque-là.
Merci encore...
Dernière modification par Bushman02 (Le 30/06/2008, à 20:55)
Hors ligne
#232 Le 30/06/2008, à 21:01
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
"xsane2tess -l fra. J'ai essayé avec tesseract -l fra"
Excuse-moi.
La bonne commande dans XSane est bien :
xsane2tess -l fra
comme indiqué dans la doc.
Mais ça bogue...
Bien... je testerai demain...
A suivre...
Hors ligne
#233 Le 30/06/2008, à 21:29
- Bushman02
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Sorbus,
Comme je dois m'absenter demain pour la journée, j'ai opté pour la solution radicale, c'est-à-dire sudo apt-get remove xsane, ce qui a eu pour effet de désinstaller, du même coup, xsane2tess.
J'ai réinstallé xsane en ligne de commande et xsane2tess à partir du script de la documentation.
Résultat : le premier essai a été le bon et le second n'a fait que confirmer le premier.
Peut-être y a-t-il un petit problème de compatibilité entre certains paquets ? Je ne suis pas assez technicien pour le dire, loin de là.
Merci, en tout cas de ton aide.
Dernière modification par Bushman02 (Le 30/06/2008, à 21:43)
Hors ligne
#234 Le 01/07/2008, à 09:39
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
@Bushman02,
Tu as bien fait de choisir cette solution. Une paille "wt" avait du se mettre en travers chez toi. Je ne comprends pas pour l'instant ni pourquoi ni comment.
J'ai testé ce matin. Pour "obtenir" le bogue, avec le même résultat que toi dans le terminal et dans le fichier xsane2tess.log, je lance xsane via le terminal. Et je configure XSane :
Préférences -> Configuration -> Onglet OCR -> Commande OCR : xsane2tess -l wt fra
Résultat dans le terminal :
/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambigûe
Résultat dans xsane2tess.log :
Tesseract Open Source OCR Engine
modif command line by b52
imagename outputbase [ -l lang OR -lwt lang] [configfile [[+|-]varfile]...
-l = Lang Without Tiff
-lwt = Lang With TiffUnable to load unicharset file /usr/share/tessdata/wt.unicharset
cat: /home/sorbus/tmp/.txt: Aucun fichier ou dossier de ce type
rm: ne peut enlever `/home/sorbus/tmp/.tif': Aucun fichier ou dossier de ce type
rm: ne peut enlever `/home/sorbus/tmp/.txt': Aucun fichier ou dossier de ce type
Puisque chez toi, xsane était configuré avec :
xsane2tess -l fra
et non pas
xsane2tess -l wt fra
... le "wt" s'est ajouté de façon inopinée à un moment du processus.
Peut-être y a-t-il un petit problème de compatibilité entre certains paquets ?
le "wt" ajouté semblerait avoir un rapport avec l'option "lwt" propre au paquet tesseract de "b52", mais je ne vois vraiment pas comment les deux ont pu interférer. Je vais poser la question à "b52" au cas où il ait une idée.
Et comme c'est résolu chez toi, ce petit bogue étant mémorisé sur ce fil, on en reste là. Si personne d'autre ne signale ce problème dans les semaines qui viennent, cela voudra dire qu'il est très marginal. Si d'autres le signalent, on cherchera plus loin.
Merci et @+
Hors ligne
#235 Le 02/07/2008, à 08:14
- Bushman02
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Merci pour tout !
Hors ligne
#236 Le 13/07/2008, à 15:23
- Leonux
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Salut à tous
Regardez si ce tuto peut amener une pierre à l'édifice :
http://ubunteros.tuxfamily.org/spip.php?article184
Le résultat est bon chez moi, voyons si c'est productible
Debian Lenny, Opensuse 11, Zenwalk snapshot, Frugalware current.
Livre interactif en ligne sur Linux ICI
Hors ligne
#237 Le 13/07/2008, à 16:26
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Salut Leonux,
Ocrad... Le retour !
Je suis un peu surpris et sceptique... Mais je vais bien sûr essayer.
J'en étais resté là.
A noter - par rapport à ton tuto - qu'avec XSane, on peut arriver encore plus directement au fichier texte sans passer par la visionneuse (quel que soit le moteur de ROC utilisé), en sélectionnant directement dans XSane :
- "enregistrer" au lieu de "visionneuse",
- le format TEXT (au lieu de PNM).
Mais je vais essayer les deux. A tout d'suite.
Dernière modification par Sorbus (Le 13/07/2008, à 16:32)
Hors ligne
#238 Le 13/07/2008, à 16:43
- Leonux
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Salut Sorbus,
A priori, après avoir navigué sur internet et testé sur ma machine, passer par le format pnm donne de meilleurs résultats ..
regarde dans le forum de l'article, j'ai fait un comparatif entre tesseract et ocrad sur un même texte ...
J'ai tenté d'intégrer ocrad et tesseract dans l'onglet OCR de Xsane. Après avoir essayé plusieurs possibilités, Ocrad est beaucoup plus à l'aise dans cette interface graphique ..
Comme je le précise, dans les deux cas, j'ai du passer par un éditeur pour modifier l'encodage avant de faire un copier/coller vers OpenOffice ..
Debian Lenny, Opensuse 11, Zenwalk snapshot, Frugalware current.
Livre interactif en ligne sur Linux ICI
Hors ligne
#239 Le 13/07/2008, à 17:05
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Je vois... Mais pour l'instant, d'une part, je n'arrive rien à sortir avec XSane+ocrad, y compris en passant par l'intermédiaire de la visionneuse et d'un format PNM (ocrad est bien installé, et j'obtiens quelque chose de pas mal avec Kooka+ocrad, mais moins bon que tesseract). D'autre part, je n'ai pas besoin de rectifier l'encodage avec XSane+xsane2tess+tesseract.
Y'a un mystère.
Dernière modification par Sorbus (Le 13/07/2008, à 17:13)
Hors ligne
#240 Le 13/07/2008, à 18:03
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Pour toute comparaison utile :
- je suis sous Ubuntu Hardy (8.04) (Gnome)
- xsane 0.995-1Ubuntu1
- ocrad 0.17-2
- tesseract 2.03 installé via le paquet de b52
Et toi Leonux ?
Hors ligne
#241 Le 13/07/2008, à 18:26
- Leonux
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
J'ai fait mon essai sous Open Suse 11 avec un KDE4 embarqué
- xsane 0.995-79.1-i586
- ocrad 0.17-43.1-586
- tesseract 2.01-5.2-586
Le tout est en paquets .rpm, bien sûr
Debian Lenny, Opensuse 11, Zenwalk snapshot, Frugalware current.
Livre interactif en ligne sur Linux ICI
Hors ligne
#242 Le 13/07/2008, à 19:48
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Il serait donc intéressant que d'autres puissent tester ta proposition sous Ubuntu pour voir s'ils ont le même problème que moi... A suivre...
Hors ligne
#243 Le 13/07/2008, à 21:38
- Leonux
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Ouaip ! Je vais sans doute commencer, j'ai une Ubuntu sur un autre ordi, il côtoie une Zenwalk..
Si je suis bien avancé dans le bricolage que je dois faire, j'essayerais demain sur ces deux distribs... ça me démange cette affaire
Debian Lenny, Opensuse 11, Zenwalk snapshot, Frugalware current.
Livre interactif en ligne sur Linux ICI
Hors ligne
#244 Le 13/07/2008, à 22:27
- Bushman02
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Peu technicien, j'ai essayé avec mon matériel et avec ses limites (scanner Canon Lide-30, Xsane 0.991, ocrad 0.16 et le tesseract de B52) : je n'ai rien obtenu, sinon des fichiers vides... malgré de nombreux essais avec divers réglages.
J'ai tenté la même chose avec Kooka pour un résultat voisin : texte illisible.
... Je suis vite revenu à xsane2tess... et j'ai vérifié qu'il marchait toujours parfaitement - à peu de chose près !
-- Bien entendu, auparavant, j'avais lu les posts de leonux. J'ai donc suivi son tuto, et j'ai surtout constaté que les résultats qu'il obtient sont similaires à ce que l'on peut obtenir grâce à tesseract (même si xsane2tess me semble d'un usage plus rapide que xsane + ocrad).
Conclusion : l'intérêt de Linux, c'est d'offrir différentes solutions selon le matériel utilisé. Encore faut-il être aidé dans ses choix... mais ce fil de discussion est en cela exemplaire.
J'espère y avoir participé positivement.
Hors ligne
#245 Le 14/07/2008, à 06:13
- Leonux
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Salut Bushman02
Conclusion : l'intérêt de Linux, c'est d'offrir différentes solutions selon le matériel utilisé. Encore faut-il être aidé dans ses choix... mais ce fil de discussion est en cela exemplaire.
Je partage sans aucune restriction ton point de vue. C'est, en effet, un point fort de GNU Linux : permettre de personnaliser son usage de l'ordi en fonction de son matériel et de ses goûts..
J'espère y avoir participé positivement.
Sans aucun doute, merci Bushman02, pour tes contributions et pour ton excellent état d'esprit.
Debian Lenny, Opensuse 11, Zenwalk snapshot, Frugalware current.
Livre interactif en ligne sur Linux ICI
Hors ligne
#246 Le 14/07/2008, à 13:00
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Oui, merci Bushmann02,
Ton essai xsane+ocrad confirme le mien : quand je disais que je n'obtenais rien, en fait, c'est exactement comme toi, le fichier de sortie est bien créé, mais il est vide.
Je vois que ta version de XSane est la 0.991, tu es sous Ubuntu Gutsy ?
@ Leonux,
Est-ce que tu as pu tester toi aussi sous Ubuntu ?
Si c'est une question de version des paquets XSane et ocrad, je vois qu'il y a dans les dépôts Ubuntu des versions légèrement plus récentes :
ocrad_0.17-3
xsane_0.996-3ubuntu2
J'essayerai avec ça dès que je pourrai.
Mais quelle que soit la version, je me demande où xsane (empaqueté pour Ubuntu) va chercher ocrad... est-ce que ce n'est pas une bête question de chemin ? J'ai essayé de lancer xsane par le terminal, mais il ne donne aucune indication... et je ne sais pas trop où trouver les fichiers de log si une trace de cet "échec" est laissée quelque part.
Dernière modification par Sorbus (Le 14/07/2008, à 13:01)
Hors ligne
#247 Le 14/07/2008, à 17:30
- Leonux
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Salut Sorbus,
Mais quelle que soit la version, je me demande où xsane (empaqueté pour Ubuntu) va chercher ocrad
Il te faut modifier un peu la conf de xsane. Par défaut, xsane va aller chercher gocr ..
J'ai donc remplacé gocr par ocrad, on peut aussi lui donner ce chemin /usr/bin/ocrad, ce qui revient au même
Tu as vu, je t'ai mis un message sur l'autre forum
Est-ce que tu as pu tester toi aussi sous Ubuntu ?
Pas encore, une belle journée ensoleillée en Normandie m'a incité à foncer au jardin.. Taille de haies, désherbage et tout le toutim, un vrai bonheur
Debian Lenny, Opensuse 11, Zenwalk snapshot, Frugalware current.
Livre interactif en ligne sur Linux ICI
Hors ligne
#248 Le 28/07/2008, à 21:15
- kimort
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Bonjour
J'ai un petit blême? Peut on m'aider?
en console:
dupont@linux07:~$ xsane2tess -i
/usr/bin/xsane2tess: line 63: $FILE_OUT : redirection ambiguë
avec kooka et gocr la page est vide
avec ocrad
Marieíniu
Duont Caull
avenu Nare Dame
ooo Bourg ant andéol
tt oq 6 g
Bowg ant andol m ullt 008
ot: demnde de remauPement d'un ow e centre oíír
honíur,
ut á un changemn d lnon fnloí u m m nfant, Denís t {fhr
Dupon, íncrt u ntr e loír l luní g uíllet, n ouront pa y aler
C't pouuaí e m permeto vou emaRr | rmaouremnt mme paRíl e
leuroum n fte n'aí aucun aîa, n | arh n da comía d'entrepríe
our payr l centre d loíîr
Vulle agréer f2oníeur In meÍlleure alutatíon
Xscane (donc Gocr) il se passe rien.
Merci!
Dernière modification par kimort (Le 29/07/2008, à 09:35)
Hors ligne
#249 Le 31/07/2008, à 10:37
- Sorbus
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Salut kimort,
xsane2tess est un adaptateur tesseract pour XSane... Essaye d'utiliser xsane2tess dans XSane plutôt qu'en console, comme indiqué ici.
Peux-tu donner quelques précisions pour qu'on puisse t'aider plus facilement :
Quel est ton système d'exploitation (Linux Ubuntu Hardy ? Linux Mandriva (version ?) ? Autre ?)
As-tu installé tesseract (quelle version, par quel moyen ?)
Quelles versions de XSane, gocr, ocrad, kooka, sont installées sur ton système ?
Hors ligne
#250 Le 02/08/2008, à 15:43
- kimort
Re : Open Office, Reconnaissance de caractères, Xsane, Kooka et Cie...
Bonjour
Merci de te proposer pour m'aider.
J'avais déjà fait le tuto pour se servir de Xsane2tess avec XScane mais il ne se passe rien quand je lui demande le mode texte.
Par contre je viens d'essayer Xsane en mettant gocr -f UTF8 à la place de xsane2tess -l fra et ça marche déjà mieux.
Tesseract est installé grâce aux paquets.
J'utilise Ubuntu Hardy.
Mes versions de programme sont:
Xsane 0.995 (la dernière)
Gocr 0.41 (la dernière)
ocrad 0.17-2 (la dernière)
kooka 4:3.59 (la dernière)
Voila merci
Dernière modification par kimort (Le 02/08/2008, à 15:50)
Hors ligne