Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 22/07/2006, à 12:32

calimarno

[Résolu] Xsane, gocr et UTF8

Salut à tous,

J'ai convaincu mes parents à passer à Linux (en dual-boot, mais c'est déjà ça) et je suis en train de configurer le scanner. Mon père a besoin de la reconnaissance de texte (OCR). Xsane utilise gocr pour convertir l'image en texte et cela fonctionne pas trop mal. Cependant, le fichier .txt généré est en ISO8859 et lorsque je l'ouvre avec OpenOffice.org tous les caractères accentués sont remplacés par des points d'interrogation.

Y a-t-il une solution soit du côté d'OpenOffice.org, soit du côté de Xsane/Gocr pour contourner le problème? Quel est le plus simple?

Merci de vos réponses.

Dernière modification par calimarno (Le 23/07/2006, à 11:28)


Les Chroniques de Calimarno -- Swisslinux.org
"Alors que tous les autres ont des problèmes, les chimistes ont des solutions!" :D
----
Pour passer un sujet en [Résolu], il suffit que l'auteur du premier message du sujet modifie le titre en cliquant sur "Modifier".

Hors ligne

#2 Le 22/07/2006, à 16:54

papadon

Re : [Résolu] Xsane, gocr et UTF8

Salut,

félicitations, tu as des parents dans le coup ... cool
Dans Xsane, aller dans Préférences->Configuration->OCR et pour le paramètre
'Commande OCR' mettre 'gocr -f UTF8'. Tu aura les accents dans OpenWriter ... wink

Dernière modification par papadon (Le 22/07/2006, à 16:54)

Hors ligne

#3 Le 23/07/2006, à 11:27

calimarno

Re : [Résolu] Xsane, gocr et UTF8

Merci papadon,

J'avais trouvé l'option -f UTF8, mais ne l'avais pas mise au bon endroit! smile
Bon dimanche!


Les Chroniques de Calimarno -- Swisslinux.org
"Alors que tous les autres ont des problèmes, les chimistes ont des solutions!" :D
----
Pour passer un sujet en [Résolu], il suffit que l'auteur du premier message du sujet modifie le titre en cliquant sur "Modifier".

Hors ligne

#4 Le 14/09/2006, à 19:24

Isaric

Re : [Résolu] Xsane, gocr et UTF8

J'ai mis dans Xsane :: gocr -f UTF8 à la place de gocr
et je scanne en 600 dpi

Le résultat est déjà bien sympathique pour une page dactilographié.
il arrive encore des erreurs comme

Voici un bref extrait :
intàšgre -->à la place intègre
dé6nition-->définition
médecin-->médecin
possà­ble-->possible

A tous les coups :
être-->être

Y a-t-il un moyen d'affiner ?


"Être bahá'í signifie simplement aimer la terre toute entière, aimer l'humanité et essayer de la servir, travailler pour la paix universelle et la famille humaine" 'Abdul'l-Bahá
"Vouloir s'ouvrir aux autres n'est pas une preuve de faiblesse, c'est une preuve d'intelligence"  Matthieu Ricard.

Hors ligne