Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 25/11/2016, à 16:07

thierry971

Une bonne solution pour convertir pdf en doc sans passer par scanner

Après avoir galéré avec l'OCR (résultats minables avec mon scanner), j'ai réussi avec PDFmod, YAGF et tesseract.
On ouvre le PDF avec Pdfmod, on extrait la première page avec un clic droit, une nouvelle fenêtre s'ouvre avec la page. Avec un clic droit on exporte l'image et on se retrouve avec un fichier jpg. J'ai eu besoin d'une rotation de l'image pour la remettre dans le bon sens.
On ouvre YAGF (avant, on a installé tesseract et tesseract-fra). Dans les réglages OCR, on pointe tesseract et le français, dans le réglage "traitement des images" on décoche "recadrer les images". On ouvre le jpg, on réarrange les 2 fenêtres et la loupe pour pouvoir sélectionner des paragraphes entiers et on clique sur OCR. On se retrouver avec le texte sur la fenêtre de droite. On enregistre le fichier txt.
Pas d'erreur. Nickel.
Plus qu'à remettre en forme.
On fait pareil avec les autres pages.

Hors ligne