Pages : 1
#1 Le 22/06/2009, à 11:34
- ramstress
probleme utf8?
Bonjour,
Je suis un utilisateur débutant de linux et dans le cadre de mon stage je dois utiliser le programme treetagger pour des corpus français.
Or après installation, lors de l'exécution du programme, je me retrouve avec ceci:
xxx:~/treetagger_3.2-3nlp2~0dapper1_amd64$ tree-tagger-french < sc.txt > scTreeTagge.txt
reading parameters ...
tagging ...
Error: empty input string in function utf8_get_char!
J'avais déjà rencontré le même problème lorsque j'avais installé initialement une version 32 bits de treetagger (ma machine est sur 64 bits), mais vu que je retombe sur exactement le même problème après installation de la bonne version, je commence à désespérer.
PS: le fichier sc.txt est bien codé en UTF8
Je vous remercie d'avance de votre aide
Hors ligne
#2 Le 22/06/2009, à 11:48
- gilbert
Re : probleme utf8?
salut,
je ne connaissais pas du tout ce programme, mais j'ai suivi les explications sur cette page : http://www.ims.uni-stuttgart.de/projekt … reeTagger/
et après tout fonctionne à la différence que pour un fichier utf8 j'appelle la commande tree-tagger-french-utf8 au lieu de tree-tagger-french ou tagger-chunker-french-utf8 au lieu de tagger-chunker-french
Simplement moi-même..
Hors ligne
#3 Le 22/06/2009, à 11:56
- ramstress
Re : probleme utf8?
Je te remercie beaucoup
Purée ça fait 4 jours que je suis dessus et j'avais même pas remarqué qu'il y existait une commande tree-tagger-french-utf8 (je m'étais borné à tree-tagger-french -_- )
Je m'excuse de t'avoir fait perdre du temps sur un truc aussi bateau ^^'
Merci encore
Hors ligne
Pages : 1