#1 Le 05/12/2011, à 03:23
- weezixx
wget sans les jambes ni les bras
Bonjour,
j'essaie de télécharger d'une page d'un site son code source (comme CTRL + U) donc je fais :
wget -qO - [url]
Mais voila, il ne me donne pas toute la page, apparemment juste l'en-tête …
Et ce sont surtout des liens qui manquent (MU), que faire ?
Merci
Hors ligne
#2 Le 05/12/2011, à 08:36
- helly
Re : wget sans les jambes ni les bras
Bonjour.
Pour télécharger une page, pas besoin d’options !
wget url
Archlinux-wmii-dwb.
Un problème résolu ? Faites le savoir en mettant [résolu] à côté du titre de votre topic.
Un problème non résolu ? Faites le savoir en insultant ceux qui cherchent à vous aider.
Un site bleu super remasterised©, un wiki cherchant des volontaires pour traduire un site.
Hors ligne
#3 Le 07/12/2011, à 13:59
- weezixx
Re : wget sans les jambes ni les bras
Ben ça marche pas, j'ai pas la même réponse qu'avec CTRL + U
Hors ligne
#4 Le 10/12/2011, à 23:27
- weezixx
Re : wget sans les jambes ni les bras
up
Hors ligne
#5 Le 11/12/2011, à 16:48
- pode
Re : wget sans les jambes ni les bras
Le contenu d'une page peut dépendre des en-têtes HTTP envoyés au serveur.
Par défaut, un navigateur envoie de nombreux en-têtes, tels que User-Agent (identifiant du navigateur), Accept-Language, Accept-Charset, Cookie (si des cookies sont déjà stockés en local), Host, ...
La liste et le contenu de ces en-têtes peuvent être récupérés via des plug-ins (sous Firefox :LiveHTTPHeaders).
Pour simuler un navigateur en ligne de commande (wget, curl, ...), il faut donc parfois rajouter des en-têtes (option --header dans wget, et aussi dans curl).
Si le contenu dépend de la valeur de cookies "dynamiques", il faut simuler tout un dialogue avec le serveur (stocker le cookie transmis par le serveur lors de la première connexion ; retransmettre ce cookie lors des connexions suivantes).
Autre possibilité : la page finale récupérée par le navigateur a été récupérée suite à des redirections HTTP (codes HTTP 3XX).
Mais par défaut wget gère les redirections (contrairement à curl, pour lequel il faut explicitement fournir l'option activant les redirections).
En bref, la façon permettant de récupérer une page depuis un client en ligne de commande, comme depuis un navigateur, dépend du comportement du serveur selon ce que le client lui a envoyé.
Hors ligne
#6 Le 15/12/2011, à 03:24
- weezixx
Re : wget sans les jambes ni les bras
Et donc ?
Pour résoudre mon problème je fais comment ?
Merci
Hors ligne
#7 Le 15/12/2011, à 03:47
- compte supprimé
Re : wget sans les jambes ni les bras
Si tu donnais l'adresse de la page, on pourrait peut-être faire des essais... Mais là, tel que c'est tu voudrais une solution à un problème dont on n'a aucun détail à part que "ça marche pas" !
Pode t'a donné toutes les indications qu'il pouvait te donner dans ces conditions...
En plus tu veux le code source d'une page. Pour en faire quoi ? Parce qu'il y a peut-être d'autres solutions...
#8 Le 15/12/2011, à 16:57
- miniSeb
Re : wget sans les jambes ni les bras
wget --user-agent="Mozilla/5.0" url
Peut-être ?
Mais c'est vrai que sans l'URL on est un peu aveugle...
Hors ligne
#9 Le 16/12/2011, à 19:13
- weezixx
Re : wget sans les jambes ni les bras
pour ce liens : [modéré : lien hors-charte]
J'ai pas les liens mégaupload
Dernière modification par xabilon (Le 17/12/2011, à 17:32)
Hors ligne
#10 Le 16/12/2011, à 19:19
- Haleth
Re : wget sans les jambes ni les bras
Parcque faut etre inscrit pour voir les liens ..
Ubuntu is an ancien African word which means "I can't configure Debian"
Because accessor & mutator are against encapsulation (one of OOP principles), good OOP-programmers do not use them. Obviously, procedural-devs do not. In fact, only ugly-devs are still using them.
Hors ligne
#11 Le 16/12/2011, à 19:20
- weezixx
Re : wget sans les jambes ni les bras
Je suis inscrit …
Hors ligne
#12 Le 16/12/2011, à 21:09
- Haleth
Re : wget sans les jambes ni les bras
T'as pas compris.
Faut etre inscrit pour voir les liens, faut etre connecté.
Sur ton navigateur, tu es connecté (via un cookie)
Avec wget, tu ne l'est pas.
Je pense que curl serai plus adapté, mais je n'ai pas d'experience sur ce sujet
Ubuntu is an ancien African word which means "I can't configure Debian"
Because accessor & mutator are against encapsulation (one of OOP principles), good OOP-programmers do not use them. Obviously, procedural-devs do not. In fact, only ugly-devs are still using them.
Hors ligne
#13 Le 17/12/2011, à 10:54
- miniSeb
Re : wget sans les jambes ni les bras
curl -u login:password url
Hors ligne
#14 Le 17/12/2011, à 23:20
- weezixx
Re : wget sans les jambes ni les bras
@miniSeb : Quand je le fais il va à la ligne et rien ne se passe
Hors ligne
#15 Le 18/12/2011, à 12:39
- miniSeb
Re : wget sans les jambes ni les bras
Étonnant..
Ça marche chez moi. Essaie de récupérer cette page du forum
curl -u weezixx:tonmdp http://forum.ubuntu-fr.org/viewtopic.php?pid=7484841
pour voir si tu as aussi ce souci...
Hors ligne
#16 Le 19/12/2011, à 02:09
- weezixx
Re : wget sans les jambes ni les bras
oui j'ai une réponse
et même en bêtement copiant collant ta ligne (donc avec comme mot de passe :tonmdp), ça fonctionne, bizarre non ?
Dernière modification par weezixx (Le 19/12/2011, à 02:26)
Hors ligne
#17 Le 19/12/2011, à 02:24
- weezixx
Re : wget sans les jambes ni les bras
Mais pour l'autre site j'ai sa comme réponse :
curl: (52) Empty reply from server
Hors ligne
#18 Le 19/12/2011, à 09:27
- helly
Re : wget sans les jambes ni les bras
T’as contacté le webmaster du site ?
Archlinux-wmii-dwb.
Un problème résolu ? Faites le savoir en mettant [résolu] à côté du titre de votre topic.
Un problème non résolu ? Faites le savoir en insultant ceux qui cherchent à vous aider.
Un site bleu super remasterised©, un wiki cherchant des volontaires pour traduire un site.
Hors ligne
#19 Le 19/12/2011, à 12:43
- weezixx
Re : wget sans les jambes ni les bras
C'est pas le genre de site ou tu contactes le webmaster,
Hors ligne
#20 Le 19/12/2011, à 14:32
- Haleth
Re : wget sans les jambes ni les bras
Helly, si t'as pas suivit, c'est pour recup un post de chez wawa... Hm.
En fait, après test, on se heurt à la joie de ce site : des fois ca marche (la chance !), des fois ca marche pas (erreur 500, ou un timeout..)
curl -v -u login:passwd http://***********/viewtopic.php?id=1126557
* About to connect() to ***************** port 80 (#0)
* Trying 194.28.158.142... ^C
Ubuntu is an ancien African word which means "I can't configure Debian"
Because accessor & mutator are against encapsulation (one of OOP principles), good OOP-programmers do not use them. Obviously, procedural-devs do not. In fact, only ugly-devs are still using them.
Hors ligne