Contenu | Rechercher | Menus

Annonce

Si vous rencontrez des soucis à rester connecté sur le forum (ou si vous avez perdu votre mot de passe) déconnectez-vous et reconnectez-vous depuis cette page, en cochant la case "Me connecter automatiquement lors de mes prochaines visites".

#1 Le 19/12/2012, à 18:29

Chloros

[10.04] Edition de paragraphes complets de PDF

Bonsoir tout le monde,
Ce sujet risque d'attirer les trolls en tout genre donc j'espère qu'il sera effacé dès que j'aurais ma réponse.
Je cherche un programme sous un vieil Ubuntu (Lucid Lynx) qui me permettrait d'éditer la partie texte de n'importe quel PDF en respectant la mise en forme d'origine du texte et capable malgré tout de reconnaître un paragraphe quand il y en a un. La question peut paraître ridicule mais le fait est que je commence à atteindre le fond en matière de performances à cause de ce détail :
− Inkscape crée autant de boîtes de texte qu'il y a de lignes à mon paragraphe. La lettrine occupe même 1 boîte à part.
− PDF Edit aussi, mais pousse le vice à ne pas remplacer le texte anglais par ma traduction quand je la copie-colle.
− OOo-importpdf déforme totalement le document (mon texte est décalé hors de la page aléatoirement).
− Scribus me fait le même coup, sauf qu'il fait plus fort (mauvaises dimensions de pages, texte en mode miroir, pas d'image).

J'ai un superbe document de 60 pages sur les montres russes, la traduction est faite, reste juste à remplacer le texte anglais (côte à côte avec le texte russe) par ma traduction. Si je dois m'amuser à changer chaque ligne de chaque page une par une puis fusionner toutes ces pages (ben oui, puisqu'Inkscape ne traite qu'une page à la fois), le temps va paraître long.

Voilà voilà. Merci d'avance à ceux qui auront une astuce à me proposer smile .

Hors ligne

#2 Le 19/12/2012, à 18:38

Brunod

Re : [10.04] Edition de paragraphes complets de PDF

Faut voir comment a été créé le pdf de départ : éditable, vectoriel... pour voir si le texte est éditable en tant que tel.
Peux-tu poster le pdf qq part ?
PS L.Lynx n'est pas si vieux, je n'en utilise pas encore d'autre wink


Windows est un système d'exploitation de l'homme par l'ordinateur.
Linux, c'est le contraire ... --> état de la conversion : 34 pc linux

En ligne

#3 Le 19/12/2012, à 19:22

Chloros

Re : [10.04] Edition de paragraphes complets de PDF

Brunod a écrit :

Peux-tu poster le pdf qq part ?

Non : le document m'a été confié par mon client pour que je le traduise mais bien évidemment, il est hors de question de le distribuer ou d'entrer dans les détails du contenu, je ne peux que parler de sa mise en forme générale. Savoir qu'il s'agit d'un manuel de montres russes impliquant des images, du texte russe et des graphiques de fonctionnement (pour les différents modes des montres), c'est déjà pas mal d'infos même si seule une personne concernée… voire avisée… peut savoir de quoi il retourne. Naturellement, ce n'est pas un scan (je l'aurais précisé sinon). Je peux sélectionner le texte et placer des annotations avec le Adobe Reader de Windows sur le PC familial, et éditer le texte sous Inkscape mais uniquement bloc par bloc et sans mise en forme (le texte est justifié dans le PDF d'origine, placer le français force l'alignement à gauche et change la proportion de texte disponible).

Brunod a écrit :

PS L.Lynx n'est pas si vieux, je n'en utilise pas encore d'autre wink

Ça fait plaisir à lire (je me sentais bien seul, sous mon "vieux" Gnome 2).

Hors ligne

#4 Le 19/12/2012, à 19:33

erresse

Re : [10.04] Edition de paragraphes complets de PDF

Peut-être PDFTK, avec éventuellement l'interface PDF Chain ?
As-tu essayé celui-là ?


Plus de 40 ans d'informatique, ça en fait des lignes de commandes en console, mais on n'avait pas le choix...
Excellente raison pour, aujourd'hui qu'on le peut, utiliser au maximum les INTERFACES GRAPHIQUES !

Hors ligne

#5 Le 19/12/2012, à 19:42

Chloros

Re : [10.04] Edition de paragraphes complets de PDF

Comme l'indique sa description, PDFTK sert à découper, concaténer, extraire du texte, des images ou des pages, pivoter, crypter, etc… des PDF. Certes je n'ai pas l'interface PDF Chain mais d'après ce que j'en lis [à cette adresse], celle-ci ne sert qu'à utiliser PDFTK sans ligne de commande, ce qui m'est totalement inutile. J'apprécie tout de même la participation, erresse, merci smile .

[EDIT] yikes Ah ! À moins que tu ne veuilles en fait des méta-données du document pour savoir comment il a été fabriqué, en fait ? Je n'avais pas songé à ça…

[EDIT2] Je pense en revanche pouvoir apporter quelques renseignements intéressants :

captureeyu.png

Dernière modification par Chloros (Le 19/12/2012, à 20:34)

Hors ligne

#6 Le 19/12/2012, à 21:42

Brunod

Re : [10.04] Edition de paragraphes complets de PDF

Hmm; ce que tu m'as dit ne m'aide pas; si tu ouvres le fichier pdf avec un éditeur hexa, tu vois le texte ?
EDIT: j'ai relu ta réponse et le contenu, la mise en forme générale et les illustrations, on s'en fout. En fait, il existe différentes manières d'encoder un pdf et donc son texte; c'est ça qu'il nous faut savoir pour déterminer comment le modifier.

Dernière modification par Brunod (Le 19/12/2012, à 21:52)


Windows est un système d'exploitation de l'homme par l'ordinateur.
Linux, c'est le contraire ... --> état de la conversion : 34 pc linux

En ligne

#7 Le 20/12/2012, à 10:51

Chloros

Re : [10.04] Edition de paragraphes complets de PDF

Pour le moment, mes recherches sur internet m'indiquent surtout que l'édition de texte de PDF est surtout bien supportée chez Adobe Acrobat (149€) ou sur Page Plus X (99€). Evidemment, "édition" signifiant pour moi avec respect de l'intégralité des données (dimensions, alignement, polices, couleurs, etc.). Comme mon document fait 60 pages, pas moyen de le convertir en Word par des moyens gratuits, apparemment.

J'ai chargé le fichier sur GHex (O_o' rapide !) et le texte contenu n'apparaît pas. En revanche, il y a des morceaux d'en-tête morcelés en début de fichier, et un texte vraiment bizarre en fin de fichier, débutant par "endstream endobj" et finissant par " [ /FlateDecode ]>> stream". Sur le dernier dixième de fichier, la colonne indique carrément "null" tout du long et boucle avec des nombres décimaux. J'espère que ce n'est pas trop grave.

Pour savoir comment le texte a été encodé, ne vaudrait-il mieux pas jeter un  œil sur la façon de faire d'InDesign ?

Hors ligne

#8 Le 20/12/2012, à 11:34

Brunod

Re : [10.04] Edition de paragraphes complets de PDF

Je passe la main. Mon idée ne marchera pas si tu ne vois pas le texte d'origine en éditant en hexa.
Reste les outils Adobe payants, à facturer à ton client wink


Windows est un système d'exploitation de l'homme par l'ordinateur.
Linux, c'est le contraire ... --> état de la conversion : 34 pc linux

En ligne

#9 Le 20/12/2012, à 12:23

Chloros

Re : [10.04] Edition de paragraphes complets de PDF

neutral 不吉です。 Bien sûr, mon client va adorer voir sa facture grimper d'une centaine d'euros roll .
Pour l'instant, je vais essayer d'éditer les pages entièrement en anglais avec le texte traduit en français, mais ça va coûter l'alignement du texte. Ensuite je recollerai les morceaux avec PDFTK. Dans tous les cas, ce sera n'importe quoi : j'aurais pu boucler ce job en 48 heures, j'en suis à plus de 72 heures pour de bêtes histoires de codage.

Hors ligne

Haut de page ↑