Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 06/03/2006, à 19:02

mathesis

[Résolu] problème d'accents avec pdftotext

Bonjour,

Je faisais auparavant mon CV sous windows avec Miktek + Winedt.
J'ai donc un fichier .tex codé à priori en ISO 8859-15.
J'en faisais un pdf avec PDFLatex.
Ce pdf je le transformais avec pdftotext depuis linux pour en extraire le texte. Je n'ai jamais eu aucun problème, même si linux ubuntu est en utf-8

Depuis peu je me suis remis à modifier ce fichier .tex avec kile (donc sous linux et non plus windows), en faisant attention à mettre l'encodage à ISO 8859-15 par défaut (nouvelle breezy installée). Les accents du .tex sont correctement gérés.
Mon PDF est très bien généré avec PDFLatex, pas de problème d'accents avec le pdf obtenu sous linux.

Cependant lorsque je convertis ce pdf (comme celui que je peux générer à partir de windows) avec pdftotext tout est chamboulé à cause des accents.

Je ne vois pas où est la solution. Est-ce qu'il y a une différence au niveau de la conversion tex --> pdflatex sous ubuntu par rapport à windows et comment puis-je y remédier (moteur différent) ? Je ne pense pas que le .tex soit en cause étant donné qu'il a toujours été en ISO 8859-15.

PS: j'utilise toujours l'option -layout, j'ai essayé de regarder si c'était mieux avec l'option -enc en plus mais je n'arrive pas à l'utiliser.

Si vous avez des idées, elles seront les très bien venues.

Dernière modification par mathesis (Le 08/03/2006, à 02:30)

Hors ligne

#2 Le 07/03/2006, à 12:38

mathesis

Re : [Résolu] problème d'accents avec pdftotext

Up.

Hors ligne

#3 Le 07/03/2006, à 18:36

mathesis

Re : [Résolu] problème d'accents avec pdftotext

Il semble que la cause soit due à un problème de polices.

J'avais auparavant :
\usepackage{ae}
\usepackage[cm]{aeguill}
Elles me causaient le problème d'accents.

J'ai remplacé ça par
\usepackage{times}
C'est moche au niveau du pdf mais pdftotext est content.

Par contre s'il y a un moyen de convertir en text un pdf généré avec la police ae ça m'intéresse.
Je resignale que c'est la première fois que je rencontre ce problème de conversion ...

Hors ligne

#4 Le 08/03/2006, à 02:33

mathesis

Re : [Résolu] problème d'accents avec pdftotext

La solution est à trouver dans la police "ae".
C'est une police bricolée pour certains glyphes.
Le résultat était propre pour le pdf (même si la police n'était pas clair pour lui, il devait faire des images de temps à autre) mais en ascii cela partait évidemment en vrille.

Solution, j'ai viré
- \usepackage{ae}
- \usepackage[cm]{aeguill}
J'utilise à la place la polic lmodern (package ubuntu à installer)
\usepackage{lmodern}

Le résultat est très similaire.

Liens :
http://groups.google.fr/group/fr.comp.text.tex/browse_thread/thread/8186c8acdc05508b/a93608f1f6a46082?lnk=st&q=%5Bcyr%5D%5Baeguill%7D&rnum=1&hl=fr#a93608f1f6a46082
http://forum.hardware.fr/hardwarefr/WindowsSoftwareReseaux/Topic-unique-LaTeX-R-sujet-152676-48.htm
ftp://ftp.tex.ac.uk/tex-archive/info/l2tabu/french/l2tabufr-heavy.pdf

Hors ligne

#5 Le 08/03/2006, à 10:00

aleph

Re : [Résolu] problème d'accents avec pdftotext

> mathesis

Deux petites remarques.

1) lmodern est une bonne solution.
2) Le package times est obsolète (depuis fort longtemps). La police "roman" est obtenue de préférence avec le package mathptmx. Tout est expliqué dans psnfss2e.pdf.