Pages : 1
#1 Le 04/01/2024, à 11:27
- Ubuntu1
wget
Bonjour,
Je trouve certains TUTO et réponse du Forum super ==> je voudrais garder une version html.
Alors j'ai tapé :
wget -p https://forum.ubuntu-fr.org/viewtopic.php?id=1988280
Mais je n'obtiens pas la page attendue
(je dois trouver la commande wget pour y ajouter mon MDP ??)
Dernière modification par Ubuntu1 (Le 04/06/2024, à 21:01)
Hors ligne
#2 Le 04/01/2024, à 16:28
- alv37
Re : wget
Slt, essaye ceci:
wget -E -k -p https://forum.ubuntu-fr.org/viewtopic.php?id=1988280
PC #1: (Custom): VoidLinux | DE: Cinnamon | MB: MS-7823 (MSI B85M-G43) | CPU: Intel i7 4790k | RAM: 8 Go | GPU: Nvidia Geforce GTX 970
PC #2: (Custom): Linux Mint 22 | DE: Cinnamon | MB: Gigabyte GA-G31M-ES2L v2 | CPU: Intel Pentium D 915 | RAM: 4 Go | GPU: Intel 82G33/G31 Express Integrated Graphics
Hors ligne
#3 Le 04/01/2024, à 20:50
- Ubuntu1
Re : wget
Slt, essaye ceci:
wget -E -k -p https://forum.ubuntu-fr.org/viewtopic.php?id=1988280
Trop Top !! Super !! Merci !
Hors ligne
#4 Le 26/05/2024, à 16:29
- Ubuntu1
Re : wget
Hello,
J'essaie de récupérer aussi les fiches qui sont en pdf à la racine mais ça ne fonctionne pas quand je tape :
wget -E -k -p https://www.charivarialecole.fr/archives/2539
pour le site:
https://www.charivarialecole.fr/archives/2539
qu'est ce qui me manque ?
merci
Hors ligne
#5 Le 26/05/2024, à 17:45
- berserk
Re : wget
Bonjour
Hello,
J'essaie de récupérer aussi les fiches qui sont en pdf à la racine mais ça ne fonctionne pas quand je tape :
wget -E -k -p https://www.charivarialecole.fr/archives/2539pour le site:
https://www.charivarialecole.fr/archives/2539qu'est ce qui me manque ?
merci
wget -r -l1 -H -t1 -nd -N -np -A.pdf -erobots=off --wait=2 --random-wait --limit-rate=20k https://www.charivarialecole.fr/archives/2539
vu ici : https://unix.stackexchange.com/question … using-wget
Sinon il me semble que y avait une extension Firefox qui permettait de faire ça, je sais pas si elle existe toujours.
EDIT : oui elle existe toujours c'est Downthemall et ça peut faire exactement ce que tu demandes.
Tu peux filtrer les liens pour n'avoir que les pdf cochés et ensuite les télécharger.
Dernière modification par berserk (Le 26/05/2024, à 17:51)
Hors ligne
#6 Le 03/06/2024, à 17:43
- Ubuntu1
Re : wget
oh super !! MERCI je vais tester les deux !!
Hors ligne
#7 Le 04/06/2024, à 21:03
- Ubuntu1
Re : wget
Finalement je réouvre le topic j'ai tapé :
wget -r -l 1 -nH -nd -np --ignore-case -A '*.pdf' https://www.charivarialecole.fr/archives/2539
j'ai obtenu un message d'erreur :
--2024-06-04 21:59:32-- https://www.charivarialecole.fr/archives/2539
Résolution de www.charivarialecole.fr (www.charivarialecole.fr)… 178.32.112.212
Connexion à www.charivarialecole.fr (www.charivarialecole.fr)|178.32.112.212|:443… connecté.
requête HTTP transmise, en attente de la réponse… 200 OK
Taille : 138645 (135K) [text/html]
Enregistre : ‘2539.tmp’
2539.tmp 100%[===================>] 135,40K --.-KB/s ds 0,1s
2024-06-04 21:59:32 (1,34 MB/s) - ‘2539.tmp’ enregistré [138645/138645]
Suppression de 2539.tmp puisqu’il devrait être rejeté.
Terminé — 2024-06-04 21:59:32 —
Temps total effectif : 0,3s
Téléchargés : 1 fichiers, 135K en 0,1s (1,34 MB/s)
Et je ne trouve aucun fichier
Hors ligne
#8 Le 05/06/2024, à 16:04
- erresse
Re : wget
2539.tmp 100%[===================>] 135,40K --.-KB/s ds 0,1s
2024-06-04 21:59:32 (1,34 MB/s) - ‘2539.tmp’ enregistré [138645/138645]
Suppression de 2539.tmp puisqu’il devrait être rejeté.
Ben, c'est plutôt normal, puisqu'il y a un message qui t'avertit que le fichier a été supprimé...
Par contre, je ne saurais pas expliquer la raison de cette suppression.
Plus de 50 ans d'informatique, ça en fait des lignes de commandes en console, mais on n'avait pas le choix...
Excellente raison pour, aujourd'hui qu'on le peut, utiliser au maximum les INTERFACES GRAPHIQUES !
Important : Une fois le problème solutionné, pensez à clore votre sujet en ajoutant [Résolu] devant le titre du 1er message, et un bref récapitulatif de la solution à la fin de celui-ci. Merci.
Hors ligne
#9 Le 05/06/2024, à 17:23
- Astrolivier
Re : wget
le fichier est supprimé parce que c'est demandé, (on ne veut que les liens)
après tentative et aide de chat gpt il manque l'option -H pour suivre les liens
wget -r -l1 -nH -nd -np -H --ignore-case -A '*.pdf' https://www.charivarialecole.fr/archives/2539
ou plus simplement
wget -r -l1 -H -nd -A pdf https://www.charivarialecole.fr/archives/2539
S'il faut absolument faire des sacrifices pour assurer le progrès de l'humanité, ne serait-il pas indispensable de s'en tenir au principe selon lequel c'est à ceux dont on exige le sacrifice que la décision doit revenir en dernier ressort ? (howard zinn)
Hors ligne
#10 Le 09/06/2024, à 21:47
- Ubuntu1
Re : wget
oh merci pour l'aide il falllait le trouver !!!
je pensais que wget suivait les liens d'une pageweb ? tu as mis quoi pour avoir trouver avec Chat GPT ?
Hors ligne
#11 Le 10/06/2024, à 18:05
- Ubuntu1
Re : wget
question : je ne retrouve pas la page web HTML ou HTM sur laquelle cliquer, j'ai bien par contre la globalité des fichiers pdf ...
Dernière modification par Ubuntu1 (Le 12/06/2024, à 17:53)
Hors ligne
Pages : 1