Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 22/06/2009, à 11:34

ramstress

probleme utf8?

Bonjour,

Je suis un utilisateur débutant de linux et dans le cadre de mon stage je dois utiliser le programme treetagger pour des corpus français.
Or après installation, lors de l'exécution du programme, je me retrouve avec ceci:

xxx:~/treetagger_3.2-3nlp2~0dapper1_amd64$ tree-tagger-french < sc.txt > scTreeTagge.txt
    reading parameters ...
    tagging ...
Error: empty input string in function utf8_get_char!

J'avais déjà rencontré le même problème lorsque j'avais installé initialement une version 32 bits de treetagger (ma machine est sur 64 bits), mais vu que je retombe sur exactement le même problème après installation de la bonne version, je commence à désespérer.

PS: le fichier sc.txt est bien codé en UTF8

Je vous remercie d'avance de votre aide

Hors ligne

#2 Le 22/06/2009, à 11:48

gilbert

Re : probleme utf8?

salut,

je ne connaissais pas du tout ce programme, mais j'ai suivi les explications sur cette page : http://www.ims.uni-stuttgart.de/projekt … reeTagger/

et après tout fonctionne à la différence que pour un fichier utf8 j'appelle la commande tree-tagger-french-utf8 au lieu de tree-tagger-french ou tagger-chunker-french-utf8 au lieu de tagger-chunker-french


Simplement moi-même..

Hors ligne

#3 Le 22/06/2009, à 11:56

ramstress

Re : probleme utf8?

Je te remercie beaucoup smile
Purée ça fait 4 jours que je suis dessus et j'avais même pas remarqué qu'il y existait une commande tree-tagger-french-utf8 (je m'étais borné à tree-tagger-french -_- )

Je m'excuse de t'avoir fait perdre du temps sur un truc aussi bateau ^^'

Merci encore wink

Hors ligne