[Résolu] codage caractère via libre office

ar barzh paour · Le 24/10/2016, à 18:15

difficile d'expliquer ce qui ne va pas

j'ai (au moins) deux fichiers que je tiens à jour manuellement via le tableur libre office

pour pouvoir effectuer des grep sur ces fichiers texte
je transforme ces fichiers sous libreoffice en fichiers texte de la façon suivante
Fichier / Enregistrer sous

Tous les formats : je choisis Texte CSV (.csv)

Je coche Editer les paramètres du filtre
Utiliser le format csv

Jeu de caractères : je laisse Unicode (UTF-8)
Séparateur de champ : je choisis ; au lieu de ,

OK

ce que je ne comprends pas c'est pourquoi certains caractères ne sont pas codés de la même façon
exemple
apostrophe est codé 27 dans un fichier et E2 80 99 dans l'autre

quand j'effectue un grep d'apostrophe dans le fichier , dans un cas il trouve et pas dans l'autre

je me suis arraché les cheveux qui me restent avant de m'apercevoir de cette différence de codage

et puis ceci : accrochez-vous !!!

un fichier tout simple

1  A		B
2  Col1		Col2
3 il est bête	mais il n'est pas méchant
4  c'h		C'H

j'enregistre sous essai.ods
puis sous Texte Csv comme indiqué au dessus

j'obtiens le fichier texte essai.csv qui ouvert par gedit me visualise
Col1;Col2
il est bête;mais il n’est pas méchant
c’h;C’H

SAUF que quand je regarde le codage de l'apostrophe j'ai E2 80 99
avec GHEX , je demande la transformation de E2 80 99 en 27

visuellement ça ne change rien (par gedit)

maintenant je ré-ouvre ce fichier via libre office

j'accepte (ou je modifie) les options de séparateur : Point-virgule

libre office me visualise le fichier identiquement à ce que j'avais avant

1  A		B
2  Col1		Col2
3 il est bête	mais il n'est pas méchant
4  c'h		C'H

là ça se corse
je ré-enregistre ce fichier en texte.csv sous essai2.csv
et je regarde le codage de l'apostrophe : 27 !!!!!!!!!!!!!!!!!!!

je résume la manip
fichier
enregistrement sous fichier.csv =====> aspostrophe codée E2 80 AA
modification de E2 80 AA en 27 dans ce fichier
ouverture de fichier.csv via libre office
enregistrement sous fichier2.csv ===> apostrophe codée 27

y-a-t-il une explication ? ET un remède !

Dernière modification par ar barzh paour (Le 25/10/2016, à 10:04)

Compte anonymisé · Le 24/10/2016, à 22:53

pour avoir directement l'apostrophe "27" tu peux faire : insertion > caractères spéciaux ... et tu choisi l’apostrophe (ça sera écrit 27)

OU

si tu veux l'avoir à chaque fois : Outils > Options d'Autocorrection ... > Options linguistiques et tu décoches guillemets simples

Dernière modification par Compte anonymisé (Le 24/10/2016, à 22:54)

pingouinux · Le 25/10/2016, à 08:06

Bonjour,
Si ça peut aider

’ => <U2019>     /xe2/x80/x99 RIGHT SINGLE QUOTATION MARK
' => <U0027>     /x27         APOSTROPHE
  => <U202A>     /xe2/x80/xaa LEFT-TO-RIGHT EMBEDDING

ar barzh paour · Le 25/10/2016, à 09:19

@ pingouinux : ça me permets de revoir mes tables unicodes

@ Anonyme68
merci c'est une solution je m'en sors comme ça

quand même pour mémoire , les caractères "Apostrophe" existant dans le fichier restent codés E2 80 99 , seuls les nouvelles saisies sont codées 27
donc ce que je vais faire :
transformer le fichier ods en csv
via GHEX (ou autre façon) remplacer les E2 80 99 en 27
réouvrir le fichier csv avec libre office et faire la sauvegarde du document ainsi modifié (en .ods)

après essai , cela fonctionne bien

il faut remarquer aussi qu'une option reste valable pour tous les fichiers ouvert par libre office

(j'ajoute cette remarque parce que je ne suis pas un très grand connaisseur des finesses de libre office)

merci encore Anonyme68 pour cette solution !

Dernière modification par ar barzh paour (Le 25/10/2016, à 10:04)

pingouinux · Le 25/10/2016, à 09:39

ar barzh paour a écrit :

quand même pour mémoire , les caractères "Apostrophe" existant dans le fichier restent codés E2 80 99 , seuls les nouvelles saisies sont codées 27

Ce sont deux caractères différents (même si ça ne se voit pas beaucoup) :
’ => RIGHT SINGLE QUOTATION MARK
' => APOSTROPHE

ar barzh paour · Le 25/10/2016, à 10:00

@pingouinux
oui cependant quand j'effectue une saisie je n'utilise que le signe qui se trouve sur la touche 4 (donc pour moi apostrophe)
je ne voyais pas pourquoi je pouvais obtenir des codages différents

pingouinux · Le 25/10/2016, à 10:10

Est-ce toi qui as créé le fichier d'origine (celui contenant le caractère codé e28099) ?

ar barzh paour · Le 25/10/2016, à 13:25

@ pingouinux

je ne sais plus trop comment j'ai débuté ce fichier qui date de plusieurs dizaines d'années et il se peut qu'à l'origine je sois parti d'une reconnaissance de caractères et non d'une saisie manuelle

tu peux essayer facilement par exemple une seule cellule contenant c'h
et suivant l'option linguistique (guillemets simples) cochée ou non, on obtient dans le fichier .csv un codage à 27 ou à e2 80 99
en tout cas c'est ce qui se produit sur ma machine

il y a une autre option (guillemets) mais comme je n'utilise pas les guillemets je n'ai pas regardé ce qui se passait

de plus sur la visualisation du caractère , je n'utilise le fichier .csv que via grep

Dernière modification par ar barzh paour (Le 25/10/2016, à 13:43)

pingouinux · Le 25/10/2016, à 13:30

et suivant l'option linguistique (guillemets simples) cochée ou non, on obtient dans le fichier .csv un codage à 27 ou à e2 80 99

Où se trouve cette option ?

ar barzh paour · Le 25/10/2016, à 13:37

dans le menu de LibreOffice
Outils / Options d'Autocorrection / Options liguistiques

EDIT : j'ai modifié mon post #8 , c'est certainement du à l'origine du fichier qui contenait donc des "27" , par la suite les saisie manuelles étaient codées E2 80 99

Dernière modification par ar barzh paour (Le 25/10/2016, à 13:45)

pingouinux · Le 25/10/2016, à 13:56

Apparemment, quand tu coches la case, le remplacement ne s'effectue qu'au moment de la frappe, et pas sur les caractères déjà présents dans les fichiers que tu ouvres.

ar barzh paour · Le 25/10/2016, à 14:19

dans mon post #4 j'ai écrit

quand même pour mémoire , les caractères "Apostrophe" existant dans le fichier restent codés E2 80 99 , seuls les nouvelles saisies sont codées 27

c'est peut-être cela que tu veux dire

pingouinux · Le 25/10/2016, à 14:27

ar barzh paour a écrit :

dans mon post #4 j'ai écrit
quand même pour mémoire , les caractères "Apostrophe" existant dans le fichier restent codés E2 80 99 , seuls les nouvelles saisies sont codées 27
c'est peut-être cela que tu veux dire

Oui, quand la case Remplacement n'est pas cochée.
Ce qui est déjà dans le fichier lors de l'ouverture n'est pas touché. Seules les nouvelles frappes tiennent compte de l'option de remplacement en cours.

Compte anonymisé · Le 25/10/2016, à 21:06

Oui, l'autocorrection corrige que ce qu'on écrit pas ce qu'il est déjà écrit.

Après tu peux corriger les caractères déjà existant avec un simple rechercher & remplacer du menu édition.

Tu copies le caractère qui pose problème et tu le colles dans le champ rechercher puis tu met le bon caractère dans le champ remplacer par

Ubuntu-fr

Navigation

Liens de recherche

Annonce

#1 Le 24/10/2016, à 18:15

[Résolu] codage caractère via libre office

#2 Le 24/10/2016, à 22:53

Re : [Résolu] codage caractère via libre office

#3 Le 25/10/2016, à 08:06

Re : [Résolu] codage caractère via libre office

#4 Le 25/10/2016, à 09:19

Re : [Résolu] codage caractère via libre office

#5 Le 25/10/2016, à 09:39

Re : [Résolu] codage caractère via libre office

#6 Le 25/10/2016, à 10:00

Re : [Résolu] codage caractère via libre office

#7 Le 25/10/2016, à 10:10

Re : [Résolu] codage caractère via libre office

#8 Le 25/10/2016, à 13:25

Re : [Résolu] codage caractère via libre office

#9 Le 25/10/2016, à 13:30

Re : [Résolu] codage caractère via libre office

#10 Le 25/10/2016, à 13:37

Re : [Résolu] codage caractère via libre office

#11 Le 25/10/2016, à 13:56

Re : [Résolu] codage caractère via libre office

#12 Le 25/10/2016, à 14:19

Re : [Résolu] codage caractère via libre office

#13 Le 25/10/2016, à 14:27

Re : [Résolu] codage caractère via libre office

#14 Le 25/10/2016, à 21:06

Re : [Résolu] codage caractère via libre office

Pied de page des forums