Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 23/02/2009, à 12:38

roger64

(résolu) Formatage d'un livre

bonjour

Des amateurs ont mis en ligne un livre libre de droits "Les désenchantées" de Pierre Loti (1905). Le livre comprend 215 pages. Je le reprend pour le mettre au format Sony 9x12. Pour le moment le livre est formaté sans style particulier. Donc une seule commande est bonne pour tout l'ouvrage.

Comme vous pouvez le voir sur la copie d'écran (caractères non imprimables apparents), il y a deux problèmes :
- il y a un signe à chaque fin de ligne qui provoque un "hachage" du texte lorsque je l'importe dans mon Reader. En gros, chaque ligne se transforme en une ligne et demie dans le petit format...Cela devient illisible.

- Les sauts de paragraphe sont beaucoup trop importants. Il me suffirait d'un simple saut de ligne.

Comment régler ces deux problèmes avec OpenOffice 3 ?

1ef247a47cd941b2858df7c75da912ea.png

Les expressions régulières me font souffrir et je n'y comprend rien. Je n'arrive pas à identifier quel est le signe en fin de ligne.

Dernière modification par roger64 (Le 23/02/2009, à 21:46)

Hors ligne

#2 Le 23/02/2009, à 13:28

inbox

Re : (résolu) Formatage d'un livre

Salut,

Pour savoir ce que sont ces caractères non affichables, il te faut utiliser un éditeur hexadécimal, comme l'un de ceux indiqués ici.

Ce sont probablement des CR/LF. Si c'est bien le cas, tu verras des 0D0A à cette place.

A+

[EDIT] Il y a le paquet tofrodos disponible dans les dépôts. Un petit lien en anglais avec quelques explications. La commande dos2unix fait partie du paquet.

Dernière modification par inbox (Le 23/02/2009, à 14:08)


Un problème résolu ? Indiquez le en modifiant le titre du sujet.

Hors ligne

#3 Le 23/02/2009, à 14:53

roger64

Re : (résolu) Formatage d'un livre

@inbox
Merci de ta réponse mais houla...
S'il faut vraiment en arriver là...je renonce. :rolleyes:J'ai essayé ghex2

A titre d'exemple les quatre malheureux petits signes de fin de paragraphe ont droit à un traitement de grand seigneur:

}
\par \pard\plain \ltrpar\s1\rtlch\afs24\lang255\ltrch\dbch\af6\langfe255\hich\fs24\lang1036\loch\fs24\lang1036
\par \pard\plain \ltrpar\s1\rtlch\afs24\lang255\ltrch\dbch\af6\langfe255\hich\fs24\lang1036\loch\fs24\lang1036
\par \pard\plain \ltrpar\s1\rtlch\afs24\lang255\ltrch\dbch\af6\langfe255\hich\fs24\lang1036\loch\fs24\lang1036
\par

avec des équivalences hexadécimales approximatives de
\    p    a    r
5C  70  61  72
et des zillions de trucs que je ne comprends pas. Bref, si c'est pour passer OO en hexadécimal....ce ne sera pas pour aujourd'hui ni pour demain.

Franchement, il n'y a pas moyen avec OO de se tirer d'affaire ?

Hors ligne

#4 Le 23/02/2009, à 15:17

inbox

Re : (résolu) Formatage d'un livre

Je ne sais ou tu l'as téléchargé, mais il y a une version Sony Reader disponible.

Sinon, tu peux m'indiquer ou tu l'as eu. Je jetterai un œil.


Un problème résolu ? Indiquez le en modifiant le titre du sujet.

Hors ligne

#5 Le 23/02/2009, à 15:55

roger64

Re : (résolu) Formatage d'un livre

@inbox

Merci pour le contournement. smile
Pour ma culture générale, je garde ce fil ouvert, car j'aimerais bien comprendre.

J'ai téléchargé le livre sur le forum Mobileread français mais c'était en html, puis j'ai converti en rtf, ensuite j'ai changé des apostrophes, des signes /, quelques traces de formatage etc...

si tu veux regarder le fil original c'est ici. Il est relativement récent en plus.
http://www.mobileread.com/forums/showthread.php?t=37368&highlight=loti

Hors ligne

#6 Le 23/02/2009, à 16:21

JBF

Re : (résolu) Formatage d'un livre

Bonjour,

Pour les remplacements de caractères non imprimables dans OOo, il y a l'extension altsearch (http://extensions.services.openoffice.org/project/AltSearch) qui facilite grandement la vie.
Mais bon, remplacer tous les "retours charriot" par rien aura pour effet de faire un seul énorme paragraphe, ce qui n'est pas une bonne idée. Il faut ruser pour ne remplacer que ceux qui sont précédés d'un caractère alphanumérique.

JBF


LibreOffice : https://fr.libreoffice.org/ (téléchargement, documentation, FAQ, assistance, contribuer, ...)
Aide pour LibreOffice par la communauté francophone : https://ask.libreoffice.org/fr/

Hors ligne

#7 Le 23/02/2009, à 16:43

inbox

Re : (résolu) Formatage d'un livre

J'ai fais un essai, un peu comme le suggère JBF, mis à part que je l'ai fait avec un éditeur hexadécimal.

On constate que les fins de lignes "abusives" sont des CR/LF (0D 0A) seuls. Par contre les changements de paragraphes sont constitués de deux séquence CR/LF (0D 0A 0D 0A).

J'ai procédé comme suit :

1/ remplacé 0D 0A par 0A
2/ remplacé 0A 0A par 0D 0A
3/ remplacé 0A par 20 (20 correspond à un espace)
4/ remplacé 0D 20 par 0D 0A
5/ remplacé 0D 0A par 0D 0A 0D 0A

Le résultat semble correct à 99%.

[EDIT] J'ai travaillé avec le fichier de chez Gutenberg.

Dernière modification par inbox (Le 23/02/2009, à 16:46)


Un problème résolu ? Indiquez le en modifiant le titre du sujet.

Hors ligne

#8 Le 23/02/2009, à 16:52

roger64

Re : (résolu) Formatage d'un livre

Merci de vos retours. smile

Je n'ai pas le temps ce soir de vérifier tout cela mais je m'y mettrai demain.
C'est clair que ça ne s'improvise pas...

Hors ligne

#9 Le 23/02/2009, à 16:59

inbox

Re : (résolu) Formatage d'un livre

Bonne sieste. salut_japonais.gif

Dernière modification par inbox (Le 23/02/2009, à 17:05)


Un problème résolu ? Indiquez le en modifiant le titre du sujet.

Hors ligne

#10 Le 23/02/2009, à 20:03

Sorbus

Re : (résolu) Formatage d'un livre

Salut,

Ce post doit pouvoir être utile : ici.

Dans le cas présenté ici, je procéderais à deux remplacements automatiques successifs dans Open Office :
(en cochant bien la case "expressions régulières".)

$[espace]$$
par
\n

$
par
[espace]

P.S. : non... mon truc ne marche pas complètement.
$ (expression régulière) est bien reconnu dans OOo writer comme le saut le ligne. On peut le remplacer par un espace... Mais ça ne fait plus qu'un seul gros paragraphe.

Je n'arrive pas à trouver comment remplacer deux sauts de lignes successifs $$ par un \n (ce qui permettrait de conserver les paragraphes avant de supprimer les sauts de lignes inutiles). La recherche de OOo writer voit un saut de ligne seul $, mais pas deux sauts de ligne successifs $$.

Dommage hmm

Dernière modification par Sorbus (Le 23/02/2009, à 21:48)

Hors ligne

#11 Le 23/02/2009, à 21:43

roger64

Re : (résolu) Formatage d'un livre

@Sorbus

C'est exactement la solution. J'ai coché l'option "expression régulière" dans rechercher/remplacer puis j'ai remplacé $ par un espace, choisi "remplacer partout", cela a été exécuté 10009 fois et j'ai obtenu ce que je voulais.

Je n'ai même pas eu à utiliser l'astuce -AAA- qui ne m'arrangeait guère d'ailleurs parce que le faire pour les paragraphes d'un texte de 215 pages..:rolleyes:

Un interligne (voir photo) a été conservé parce que la marque est précédée par deux espaces dans le texte (voir photo). La marque de fin de paragraphe est également conservée je ne sais pas pourquoi mais elle est belle et bien conservée. Ouf !

Comme le texte original venait d'un html, il est possible que ces marques parasites -identifées comme des CR/LF par inbox- aient été créées lors de la conversion en rtf. Il y eu en effet un écran intermédiaire qui parle d'UTF8 de CR/LF et de choses de ce genre auxquelles je n'avais pas trop prêté attention.

@inbox et JBF

Merci beaucoup de votre aide. J'ai sans doute involontairement obscurci la recherche de la solution.

9ba2161d7d3611c77da7f4e5a44e9b13.png

Je marque résolu.:)

Dernière modification par roger64 (Le 23/02/2009, à 21:52)

Hors ligne

#12 Le 23/02/2009, à 21:50

Sorbus

Re : (résolu) Formatage d'un livre

Ah... Ben ouf ! smile
Je n'avais pas repéré si dans ton texte il existait de vraies marques de paragraphes... Si tout avait été en "$", je n'aurais pas eu la solution.

Dernière modification par Sorbus (Le 23/02/2009, à 23:29)

Hors ligne