Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 06/04/2018, à 18:25

seboseb

Sauvegarder mon blog : besoin d'aide

Bonjour,

J'ai un blog chez Overblog, qui n'évolue plus : il retrace l'autoconstruction de ma maison, et cette maison est finie (hourra !). Mon inactivité sur le blog est "punie" par la présence de pubs que je trouve gênantes ; de plus, je souhaite faire une sauvegarde en local de ce blog qui représente beaucoup de travail, une masse d'info technique, et des souvenirs importants pour ma famille et moi.

Il est bien connu qu'Overblog empêche la sauvegarde d'un blog gratuit par son auteur, j'ai donc fini par faire ce qu'ils attendaient de moi : j'ai sorti ma CB, j'ai payé un abonnement Premium. J'ai donc pu exporter un fichier xml. Bien.

Je pensais que mon blog était sauvegardé, ignorant que j'étais. Mais en y regardant de plus près, je n'ai qu'un fichier xml avec mes textes pleins de balises et des liens qui pointent vers mes photos, hébergées chez Over-blog. Donc : je suis encore 100% dépendant de cette plateforme, à la merci de leurs décisions concernant la sauvegarde de mon blog.

Je voudrais  pouvoir afficher mon blog en local. En gros, je veux avoir sur mon disque dur tout mon blog sous forme de pages html, avec des liens vers des photos hébergées elles aussi en local.

Qui peut m'aider SVP ?

PS : bien entendu, j'ai auparavant contacté le support Overblog (après tout, je suis un Premium wink )mais après quelques blablas ils ont cessé de me répondre.

Dernière modification par seboseb (Le 06/04/2018, à 18:27)

Hors ligne

#2 Le 06/04/2018, à 21:02

JBF

Re : Sauvegarder mon blog : besoin d'aide

As-tu essayé un aspirateur de site web comme httrack ?


LibreOffice : https://fr.libreoffice.org/ (téléchargement, documentation, FAQ, assistance, contribuer, ...)
Aide pour LibreOffice par la communauté francophone : https://ask.libreoffice.org/fr/

Hors ligne

#3 Le 06/04/2018, à 21:14

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Bonsoir,
j'avais essayé à une époque mais OverBlog avait déjà mis en place des dispositifs pour contrer ça.

Il me faudrait un logiciel ou un script capable de lire le fichier xml de mon blog, d'enregistrer en local toutes les images vers lesquelles pointent les liens, et de modifier enduite lesdits liens...

Je suis preneur de toute idée !!!

Hors ligne

#4 Le 06/04/2018, à 22:24

JBF

Re : Sauvegarder mon blog : besoin d'aide

Il devrait être possible d'extraire tous les liens vers les images dans un fichier texte, puis de faire un script qui va chercher les images avec une commande wget. Si toutes les images ont des noms différents, le remplacement des liens par des chemins relatifs locaux ne devrait pas être trop compliqué. Si tu as plusieurs photo1.jpg ce sera plus délicat.


LibreOffice : https://fr.libreoffice.org/ (téléchargement, documentation, FAQ, assistance, contribuer, ...)
Aide pour LibreOffice par la communauté francophone : https://ask.libreoffice.org/fr/

Hors ligne

#5 Le 06/04/2018, à 23:14

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Normalement, les photos ont toutes un nom différent. Ta stratégie me semble bonne en théorie, mais je suis malheureusement bien incapable d'écrire un script...

Mais peut-être que quelqu'un relèvera le défi ? big_smile

Dernière modification par seboseb (Le 06/04/2018, à 23:15)

Hors ligne

#6 Le 07/04/2018, à 01:07

melixgaro

Re : Sauvegarder mon blog : besoin d'aide

salut,
sans avoir (au moins) un bout du xml, ça va être dur de construire une ligne de commande efficace…

si les images sont stockées sous forme de lien absolu, peut-être que ça ferait l'affaire

grep -oEi "http[^ <>'\"]*.(jpg|jpeg|png|gif)" nom_du_fichier.xml

(mais je navigue à vue)

tu peux tester cette commande sans crainte (copie-colle dans un terminal, remplace simplement 'nom_du_fichier.xml' par le nom de ton fichier) : soit ça réussi et ça imprimera les liens dans le terminal ; soit ça rate, et il ne se passe rien.


Linux depuis ~2007. Xubuntu seulement.

Hors ligne

#7 Le 08/04/2018, à 20:02

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Merci melixgaro et désolé pour mon délai de réponse,
J'ai essayé ta commande (j'ai compris tout seul qu'il fallait se mettre dans le bon dossier big_smile ) et ça m'affiche bel et bien un gros paquet de lien. En y regardant de plus près, il n'y a qu'une partie des liens de mon blog. C'est curieux, quand je remonte l’ascenseur de la fenêtre au maximum (je ne suis pas en vraie console mais sur Terminal), je ne peux pas afficher ma commande initiale (la première ligne, c'est déjà un lien). Y a-t-il une sorte de pagination quand le texte affiché par Terminal est trop long ???

Une fois ce problème résolu, il faudra encore télécharger toutes les images dans un dossier puis remplacer dans mon fichier xml tous les liens du type http://blabla.image.jpeg par /home/user/dossier/blabla.image.jpeg...

Mes félicitations en tout cas pour ce premier résultat ! smile

PS : s'il faut publier un bout du code xml ou si tu souhaites que je te l'envoie, pas de souci !
PS bis : pour info, voici les premières lignes affichées :

http://idata.over-blog.com/3/10/58/25/mai-2011/img_8XX3_1.jpg
http://resize.over-blog.com/1020x765.jpg?http://idata.over-blog.com/3/10/58/25/mai-2011/img_8XX3_1.jpg

J'ai juste modifié le nom d'image (XX au lieu des chiffres initiaux). Je pense qu'il est bon de garder les éléments de date dans le chemin d'accès pour éviter d'éventuels doublons dans les noms d'images (photos prises pat un autre appareil que le mien ; ça peut arriver)

Dernière modification par seboseb (Le 08/04/2018, à 20:10)

Hors ligne

#8 Le 08/04/2018, à 20:08

xubu1957

Re : Sauvegarder mon blog : besoin d'aide

Bonjour,

seboseb a écrit :

Y a-t-il une sorte de pagination quand le texte affiché par Terminal est trop long ???

Regarde dans  > Retour utilisable de commande :

moko138 a écrit :

(..)
Dans certains cas, pour tout sélectionner, on ne peut procéder comme ci-dessus. Alors on procédera comme indiqué plus bas (message #8)
                          - - - - -

5) Et si le terminal refuse de remonter assez haut,
la solution - merci marcodel ! - est indiquée encore plus bas (message #9).


Conseils pour les nouveaux demandeurs et pas qu'eux
Important : Pensez à passer vos sujets en [Résolu] lorsque ceux-ci le sont, au début du titre en cliquant sur Modifier sous le premier message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.                   Membre de Linux-Azur

En ligne

#9 Le 08/04/2018, à 21:07

JBF

Re : Sauvegarder mon blog : besoin d'aide

Plutôt que d'augmenter la taille du tampon du terminal, il vaut mieux dérouter la sortie de la commande vers un fichier texte que tu pourras ensuite éditer et consulter tranquillement.

$ma_commande > fichier_sortie_commande.txt

LibreOffice : https://fr.libreoffice.org/ (téléchargement, documentation, FAQ, assistance, contribuer, ...)
Aide pour LibreOffice par la communauté francophone : https://ask.libreoffice.org/fr/

Hors ligne

#10 Le 08/04/2018, à 22:06

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Génial ! J'ai maintenant un fichier liens.txt qui contient tous mes liens.

Difficulté : ils ne sont pas tous sur le même format. Par exemple, après le http:// on peut trouver "data", i"data" ou encore "img" ou"resize". De même, le nom des photos n"a pas un nombre régulier de caractères, c'est parfois un numéro à 3 ou 4 chiffes, parfois un nom que j'avais donné à la photo. Les extensions sont .jpg  ou .JPG

Vous faites du bon boulot, continuez !  tongue

Dernière modification par seboseb (Le 08/04/2018, à 22:09)

Hors ligne

#11 Le 13/04/2018, à 21:49

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Bonjour,
je relance ce sujet. JBF suggérait qu'il est possible de télécharger les images de mon blog (rappel : j'ai maintenant la liste des liens dans un fichier texte) avec une commande wget.
L'étape suivante consiste à remplacer les liens du fichier xml de mon blog, qui pointent vers over-blog, par des liens pointant sur mes images en local.
Si quelqu'un peut m'aider à faire ça, je serais vraiment soulagé d'avoir enfin une vraie sauvegarde de mon blog et de ne plus dépendre d'Over-blog .

PS : Je m'absente quelques jours, (hors connexion) ; celui qui m'aidera aura des remerciements à partir du 20 avril !

Hors ligne

#12 Le 22/04/2018, à 11:24

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Salut,
de retour de vacance cool, j'uppe (du verbe upper bien connu du dictionnaire Robert Franglais) cette discussion, dans l'espoir de résilier mon abonnement Premium over-blog...
Allez, comment télécharger toutes mes images ?

Hors ligne

#13 Le 22/04/2018, à 20:10

moko138

Re : Sauvegarder mon blog : besoin d'aide

seboseb a écrit :

Génial ! J'ai maintenant un fichier liens.txt qui contient tous mes liens.

Si tu as exclusivement les liens dans ce fichier, tu tiens le bon bout.

Une méthode consiste
à d'abord utiliser Ctrl h  pour avoir tous tes liens sur une seule ligne, séparés par une (ou plusieurs) espaces, mais sans tabulation.

(Détail pratique : je te conseille d'activer la numérotation des lignes dans ton éditeur de texte, pour être sûr qu'aucun saut de ligne ne subsiste.)

Ensuite,
tu obtiens alors une trèèèèèès longue ligne de ce type :

http://blabla.image.jpeg https://(...).jpg    https://(...).png (...) http://www.toto.com/(...).JPG

Tu crées le répertoire vide destiné à accueillir toutes ces images et rien qu'elles :

mkdir /quelque-chose/rep-images/

Tu vérifies avec

df -h

que tu as assez d'espace dans la partition où tu as créé /quelque-chose/rep-images/.

Tu te places dans ce répertoire :

cd /quelque-chose/rep-images/

et tu tapes

wget -c -N -o mon-log.txt --

Et, avant de valider,
- tu tapes une espace [pour décoller "--" (ce sont deux tirets attachés) de la suite]
- et tu colles la trèèès longue ligne obtenue précédemment.

Il n'y a plus :
qu'à surveiller de temps en temps qu'il n'y a pas de message d'erreur,
et à patienter en regardant un bon dvd, voire en laissant tourner jusqu'au lendemain...

  - -

J'attire ton attention sur le fait que cette commande télécharge les fichiers, mais pas l'arboresence.
Donc si ton hébergeur a donné le même nom à deux images différentes à des endroits différents (/toto/a/2.jpg et /bibi/c/2.jpg), alors seule la première du nom sera téléchargée.
(ça se voit dans le fichier mon-log.txt, où apparaissent des lignes disant :

--2018-04-22 20:00:49--  http://(...)
Le fichier a déjà été complètement récupéré; rien à faire.

)
  Donc pour simplifier la lecture du log, évite de relancer la commande sans bon motif !  smile

  Si le problème d'homonymie se pose, our avoir toutes les images, il faudra utiliser d'autres options, décrites dans

man wget

%NOINDEX%
Un utilitaire précieux : ncdu
Photo, mini-tutoriel :  À la découverte de dcraw

Hors ligne

#14 Le 23/04/2018, à 10:53

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Merci, merci ! C'est très détaillé et je vais y arriver ! Mais je bute sur :

moko138 a écrit :

d'abord utiliser Ctrl h  pour avoir tous tes liens sur une seule ligne, séparés par une (ou plusieurs) espaces, mais sans tabulation.

Sur Pluma, Ctrl h active la fonction rechercher-remplacer : ça ne doit pas être ça !
J'ai donc essayé avec Nano (et là je commence déjà à transpirer), le manuel me dit qu'il y a bien un Ctrl h (j'ai compris que ^H veut dire Ctrl H) qui fait le même effet que la touche Suppr.
Donc, si je comprends bien, tu veux que je supprime manuellement les retours à la ligne, c'est ça ? Si oui, je préfère le faire avec Pluma donc sans Ctrl h (le mode graphique a ma préférence !).  Dans le doute, je m'abstiens jusqu'à ta réponse.

Par ailleurs, je m'aperçois que mes noms d'images sont tous en doublons. C'est lié au fait qu'il y a deux affichages différents sur le blog : la miniature affichée dans le texte et l'image réelle, affichable par clic. Coup de bol : dans mon fichier liens.txt l'image originale vient toujours avant la miniature ; si j'en crois ce que tu dis, je peux donc laisser tel quel, et je ne téléchargerai donc que la première image, c'est à dire la plus grande. Correct  ? (je prends note que j'aurais un fichier log très long)

Hors ligne

#15 Le 23/04/2018, à 13:10

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Je viens de trouver une solution : l'option -i permet de lire directement dans mon fichier liens.txt

wget -i liens.txt -c -N -o log.txt 

Les images sont en train d'être téléchargées dans mon dossier. Il doit y avoir une protection anti-robot sur Over-Blog car c'est devenu très lent (1 image de 1 Mo toutes les 2-3 minutes) mais ça avance. Je reviens poster ici dès que c'est terminé (demain ?)

Dernière modification par seboseb (Le 23/04/2018, à 13:12)

Hors ligne

#16 Le 23/04/2018, à 15:40

seboseb

Re : Sauvegarder mon blog : besoin d'aide

C'est terminé, j'ai toutes mes images !

Bon, il reste une ultime étape : remplacer, dans mon fichier export.xml, les liens qui pointent vers over-blog par des liens qui pointent en local. Je me propose de laisser le fichier export.xml dans le même dossier que les images. Autrement dit, pour le premier lien, remplacer
http://img.over-blog-kiwi.com/0/55/11/4 … -05-15.jpg
par
ob_810d35_2018-04-05-15.jpg
et faire ça pour les 1000 photos.
Une idée ?

Hors ligne

#17 Le 23/04/2018, à 20:16

moko138

Re : Sauvegarder mon blog : besoin d'aide

seboseb a écrit :

Sur Pluma, Ctrl h active la fonction rechercher-remplacer : ça ne doit pas être ça !

Mais si, c'est bien à ça que je pensais.
Peu importe, puisque tu as trouvé encore plus simple en court-circuitant la phase de "rechercher-remplacer" (les retours à la ligne et les tabulations, par des espaces), grâce à l'option "-i"...
que je te remercie de m'avoir fait découvrir !
  smile
  - -

Pour ta dernière demande, en #16, je passe la main.

Dernière modification par moko138 (Le 23/04/2018, à 20:19)


%NOINDEX%
Un utilitaire précieux : ncdu
Photo, mini-tutoriel :  À la découverte de dcraw

Hors ligne

#18 Le 23/04/2018, à 23:51

seboseb

Re : Sauvegarder mon blog : besoin d'aide

Ah ! On peut rechercher un retour à la ligne et le remplacer par un espace ? Par curiosité, comment fait-on ? Je veux dire, quel "caractère" doit-on entrer pour signifier que l'on recherche un retour à la ligne ?
C'est inutile pour mon cas dans l'immédiat, mais j'aime apprendre... smile

Hors ligne

#19 Le 24/04/2018, à 03:11

moko138

Re : Sauvegarder mon blog : besoin d'aide

Ctrl h      puis dans les champs :
  - "Rechercher", tu colles un retour à la ligne,
  - "Remplacer", tu tapes une(*) espace.


____
(*) En typographie, espace est du féminin, quand on parle du caractère. Tout comme les autres caractères dont le nom se prononce en commençant par une voyelle :
"F" se prononce [ èf ], --> une F


%NOINDEX%
Un utilitaire précieux : ncdu
Photo, mini-tutoriel :  À la découverte de dcraw

Hors ligne

#20 Le 24/04/2018, à 03:29

cqfd93

Re : Sauvegarder mon blog : besoin d'aide

Bonjour,

seboseb a écrit :

Ah ! On peut rechercher un retour à la ligne et le remplacer par un espace ? Par curiosité, comment fait-on ? Je veux dire, quel "caractère" doit-on entrer pour signifier que l'on recherche un retour à la ligne ?

Dans gedit, pour remplacer un retour à la ligne par une espace :
Rechercher : \n
Remplacer : < une espace >


cqfd93

Hors ligne

#21 Le 24/04/2018, à 04:09

moko138

Re : Sauvegarder mon blog : besoin d'aide

J'avais choisi de ne pas parler de \n de \r ni de \t (tabulation), parce que
- ça dépend de l'encodage du fichier texte,
- l'efficacité de \quelque-chose dépend peut-être de l'éditeur de texte (leafpad, donne le choix entre trois possibilités pour les fins de ligne, et Windows aussi offre des variantes d'encodage en .txt).


Pour contourner ces incertitudes, il suffit d'utiliser son propre éditeur de texte et de copier ce qu'on veut dans le fichier même qu'on veut modifier.

Dernière modification par moko138 (Le 24/04/2018, à 04:10)


%NOINDEX%
Un utilitaire précieux : ncdu
Photo, mini-tutoriel :  À la découverte de dcraw

Hors ligne