Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 07/01/2018, à 05:13

roger64

Créer une liste.txt des caractères italiques d'un fichier html

Bonjour

C'est actuellement la pièce de Lego manquante. Le but est de créer un greffon sur Sigil, un logiciel libre, destiné à créer des sous-ensembles de polices incorporées sur les ebooks. Ces derniers utilisent le format EPUB soit un zip de fichiers html ou xhtml. Le générateur de subset existe, c'est pyftsubset, une partie de fonttools. Excellent.

Pour parvenir à créer ces sous-ensembles, il faut déterminer quelle font-variant utilise quel caractère et en dresser la liste. On devrait avoir une liste par font-variant (soit regular, italic, bold, bolditalic pour une famille complète). Il peut aussi y avoir des livres qui n'incorporent qu'une seule variante ou qui incorporent une famille complète plus une ou deux autres font-variants venues de familles différentes. Ce n'est pas le cas général mais ça arrive. Ainsi par itérations successives, on créera autant de listes de caractères que de font-variants et le processus utilisé pour l'italique sera répété x fois.

pyftsubset fonctionne avec une liste de caractères au format txt (UTF-8). Sigil crée déjà la liste de tous les caractères utilisés dans l'EPUB dans l'outil Rapport. On peut naturellement utiliser cette liste unique produite par Sigil. Elle convient à peu près pour regular, beaucoup moins pour italic et pas du tout pour les autres.

J'avais publié en octobre dernier sur le site de MobileRead le résultat de quelques essais avec un livre test en français au format EPUB. voir ici: trials.
https://www.mobileread.com/forums/showt … =darkening

Le livre, dézippé, contient les fichiers xhtml.

Nota: fonttools étant écrit en Python, ce serait sympa si le fragment de code manquant était écrit dans le même langage.

Dernière modification par roger64 (Le 07/01/2018, à 12:54)

Hors ligne