#1 Le 23/02/2009, à 12:38
- roger64
(résolu) Formatage d'un livre
bonjour
Des amateurs ont mis en ligne un livre libre de droits "Les désenchantées" de Pierre Loti (1905). Le livre comprend 215 pages. Je le reprend pour le mettre au format Sony 9x12. Pour le moment le livre est formaté sans style particulier. Donc une seule commande est bonne pour tout l'ouvrage.
Comme vous pouvez le voir sur la copie d'écran (caractères non imprimables apparents), il y a deux problèmes :
- il y a un signe à chaque fin de ligne qui provoque un "hachage" du texte lorsque je l'importe dans mon Reader. En gros, chaque ligne se transforme en une ligne et demie dans le petit format...Cela devient illisible.
- Les sauts de paragraphe sont beaucoup trop importants. Il me suffirait d'un simple saut de ligne.
Comment régler ces deux problèmes avec OpenOffice 3 ?
Les expressions régulières me font souffrir et je n'y comprend rien. Je n'arrive pas à identifier quel est le signe en fin de ligne.
Dernière modification par roger64 (Le 23/02/2009, à 21:46)
Hors ligne
#2 Le 23/02/2009, à 13:28
- inbox
Re : (résolu) Formatage d'un livre
Salut,
Pour savoir ce que sont ces caractères non affichables, il te faut utiliser un éditeur hexadécimal, comme l'un de ceux indiqués ici.
Ce sont probablement des CR/LF. Si c'est bien le cas, tu verras des 0D0A à cette place.
A+
[EDIT] Il y a le paquet tofrodos disponible dans les dépôts. Un petit lien en anglais avec quelques explications. La commande dos2unix fait partie du paquet.
Dernière modification par inbox (Le 23/02/2009, à 14:08)
Un problème résolu ? Indiquez le en modifiant le titre du sujet.
Hors ligne
#3 Le 23/02/2009, à 14:53
- roger64
Re : (résolu) Formatage d'un livre
@inbox
Merci de ta réponse mais houla...
S'il faut vraiment en arriver là...je renonce. :rolleyes:J'ai essayé ghex2
A titre d'exemple les quatre malheureux petits signes de fin de paragraphe ont droit à un traitement de grand seigneur:
}
\par \pard\plain \ltrpar\s1\rtlch\afs24\lang255\ltrch\dbch\af6\langfe255\hich\fs24\lang1036\loch\fs24\lang1036
\par \pard\plain \ltrpar\s1\rtlch\afs24\lang255\ltrch\dbch\af6\langfe255\hich\fs24\lang1036\loch\fs24\lang1036
\par \pard\plain \ltrpar\s1\rtlch\afs24\lang255\ltrch\dbch\af6\langfe255\hich\fs24\lang1036\loch\fs24\lang1036
\par
avec des équivalences hexadécimales approximatives de
\ p a r
5C 70 61 72
et des zillions de trucs que je ne comprends pas. Bref, si c'est pour passer OO en hexadécimal....ce ne sera pas pour aujourd'hui ni pour demain.
Franchement, il n'y a pas moyen avec OO de se tirer d'affaire ?
Hors ligne
#4 Le 23/02/2009, à 15:17
- inbox
Re : (résolu) Formatage d'un livre
Je ne sais ou tu l'as téléchargé, mais il y a une version Sony Reader disponible.
Sinon, tu peux m'indiquer ou tu l'as eu. Je jetterai un œil.
Un problème résolu ? Indiquez le en modifiant le titre du sujet.
Hors ligne
#5 Le 23/02/2009, à 15:55
- roger64
Re : (résolu) Formatage d'un livre
@inbox
Merci pour le contournement.
Pour ma culture générale, je garde ce fil ouvert, car j'aimerais bien comprendre.
J'ai téléchargé le livre sur le forum Mobileread français mais c'était en html, puis j'ai converti en rtf, ensuite j'ai changé des apostrophes, des signes /, quelques traces de formatage etc...
si tu veux regarder le fil original c'est ici. Il est relativement récent en plus.
http://www.mobileread.com/forums/showthread.php?t=37368&highlight=loti
Hors ligne
#6 Le 23/02/2009, à 16:21
- JBF
Re : (résolu) Formatage d'un livre
Bonjour,
Pour les remplacements de caractères non imprimables dans OOo, il y a l'extension altsearch (http://extensions.services.openoffice.org/project/AltSearch) qui facilite grandement la vie.
Mais bon, remplacer tous les "retours charriot" par rien aura pour effet de faire un seul énorme paragraphe, ce qui n'est pas une bonne idée. Il faut ruser pour ne remplacer que ceux qui sont précédés d'un caractère alphanumérique.
JBF
LibreOffice : https://fr.libreoffice.org/ (téléchargement, documentation, FAQ, assistance, contribuer, ...)
Aide pour LibreOffice par la communauté francophone : https://ask.libreoffice.org/fr/
Hors ligne
#7 Le 23/02/2009, à 16:43
- inbox
Re : (résolu) Formatage d'un livre
J'ai fais un essai, un peu comme le suggère JBF, mis à part que je l'ai fait avec un éditeur hexadécimal.
On constate que les fins de lignes "abusives" sont des CR/LF (0D 0A) seuls. Par contre les changements de paragraphes sont constitués de deux séquence CR/LF (0D 0A 0D 0A).
J'ai procédé comme suit :
1/ remplacé 0D 0A par 0A
2/ remplacé 0A 0A par 0D 0A
3/ remplacé 0A par 20 (20 correspond à un espace)
4/ remplacé 0D 20 par 0D 0A
5/ remplacé 0D 0A par 0D 0A 0D 0A
Le résultat semble correct à 99%.
[EDIT] J'ai travaillé avec le fichier de chez Gutenberg.
Dernière modification par inbox (Le 23/02/2009, à 16:46)
Un problème résolu ? Indiquez le en modifiant le titre du sujet.
Hors ligne
#8 Le 23/02/2009, à 16:52
- roger64
Re : (résolu) Formatage d'un livre
Merci de vos retours.
Je n'ai pas le temps ce soir de vérifier tout cela mais je m'y mettrai demain.
C'est clair que ça ne s'improvise pas...
Hors ligne
#9 Le 23/02/2009, à 16:59
- inbox
Re : (résolu) Formatage d'un livre
Bonne sieste.
Dernière modification par inbox (Le 23/02/2009, à 17:05)
Un problème résolu ? Indiquez le en modifiant le titre du sujet.
Hors ligne
#10 Le 23/02/2009, à 20:03
- Sorbus
Re : (résolu) Formatage d'un livre
Salut,
Ce post doit pouvoir être utile : ici.
Dans le cas présenté ici, je procéderais à deux remplacements automatiques successifs dans Open Office :
(en cochant bien la case "expressions régulières".)
$[espace]$$
par
\n
$
par
[espace]
P.S. : non... mon truc ne marche pas complètement.
$ (expression régulière) est bien reconnu dans OOo writer comme le saut le ligne. On peut le remplacer par un espace... Mais ça ne fait plus qu'un seul gros paragraphe.
Je n'arrive pas à trouver comment remplacer deux sauts de lignes successifs $$ par un \n (ce qui permettrait de conserver les paragraphes avant de supprimer les sauts de lignes inutiles). La recherche de OOo writer voit un saut de ligne seul $, mais pas deux sauts de ligne successifs $$.
Dommage
Dernière modification par Sorbus (Le 23/02/2009, à 21:48)
Hors ligne
#11 Le 23/02/2009, à 21:43
- roger64
Re : (résolu) Formatage d'un livre
@Sorbus
C'est exactement la solution. J'ai coché l'option "expression régulière" dans rechercher/remplacer puis j'ai remplacé $ par un espace, choisi "remplacer partout", cela a été exécuté 10009 fois et j'ai obtenu ce que je voulais.
Je n'ai même pas eu à utiliser l'astuce -AAA- qui ne m'arrangeait guère d'ailleurs parce que le faire pour les paragraphes d'un texte de 215 pages..:rolleyes:
Un interligne (voir photo) a été conservé parce que la marque est précédée par deux espaces dans le texte (voir photo). La marque de fin de paragraphe est également conservée je ne sais pas pourquoi mais elle est belle et bien conservée. Ouf !
Comme le texte original venait d'un html, il est possible que ces marques parasites -identifées comme des CR/LF par inbox- aient été créées lors de la conversion en rtf. Il y eu en effet un écran intermédiaire qui parle d'UTF8 de CR/LF et de choses de ce genre auxquelles je n'avais pas trop prêté attention.
@inbox et JBF
Merci beaucoup de votre aide. J'ai sans doute involontairement obscurci la recherche de la solution.
Je marque résolu.:)
Dernière modification par roger64 (Le 23/02/2009, à 21:52)
Hors ligne
#12 Le 23/02/2009, à 21:50
- Sorbus
Re : (résolu) Formatage d'un livre
Ah... Ben ouf !
Je n'avais pas repéré si dans ton texte il existait de vraies marques de paragraphes... Si tout avait été en "$", je n'aurais pas eu la solution.
Dernière modification par Sorbus (Le 23/02/2009, à 23:29)
Hors ligne