Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 22/04/2013, à 16:19

Compte anonymisé

[Résolu] Aspirer un site web dans "un seul sens"

Bonjour,

j'aimerais aspirer un site, pour cela je compte utiliser HTTrack (et pas wget car je n'ai que des machines sous Windows là où je suis). Mais en fait j'aimerais aspirer le site à partir d'un certain répertoire sans que l'aspiration ne "revienne" pas vers l'accueil.
Un petit exemple pour que ce soit plus clair :

Je veux aspirer une rubrique d'un site dont l'adresse est, par exemple : www.unsite.fr

Sauf que je ne veux aspirer que la rubrique à l'adresse www.unsite.fr/rubrique/. Seulement cette rubrique est-elle composée de plusieurs sous-rubriques, soit:
www.unsite.fr/rubrique/sousrubrique1
www.unsite.fr/rubrique/sousrubrique2
etc


Donc moi je voudrais télécharger www.unsite.fr/rubrique/ et toute l'arborescence qui suit (soit www.unsite.fr/rubrique/ + www.unsite.fr/rubrique/sousrubrique1 + www.unsite.fr/rubrique/sousrubrique2 + www.unsite.fr/rubrique/sousrubriquen) . Donc je suis obligé de mettre une profondeur maximale de 5, sauf que quand je lance le téléchargement il repère un lien qui va vers www.unsite.fr, le télécharge et du coup (vu qu'il peut aller jusqu'à 4 liens restants) il va aspirer quasiment tout le site puisqu'il va aspirer les liens trouvés sur la page d'accueil.


J'espère avoir été assez clair. Merci à vous.

Dernière modification par titou345 (Le 24/04/2013, à 15:56)

#2 Le 22/04/2013, à 22:52

Compte anonymisé

Re : [Résolu] Aspirer un site web dans "un seul sens"

A la limite, si vous avez une solution avec wget je suis preneur aussi hein. smile

#3 Le 24/04/2013, à 15:34

Compte anonymisé

Re : [Résolu] Aspirer un site web dans "un seul sens"

Nan mais le www.unsite.fr était juste un exemple. Je n'avais même pas fait attention que le nom de domaine existait. Ce que je demande c'est juste une manipulation pour aspirer, en général, n'importe quel site web mais en enregistrant les liens qui vont uniquement vers les sous-répertoires et pas ceux qui redirigent vers le répertoire parent voire l'accueil du site.

Dernière modification par titou345 (Le 24/04/2013, à 15:34)

#4 Le 24/04/2013, à 15:38

Brunod

Re : [Résolu] Aspirer un site web dans "un seul sens"


Windows est un système d'exploitation de l'homme par l'ordinateur. Linux, c'est le contraire...
39 pc linux convertis

Hors ligne

#5 Le 24/04/2013, à 15:45

Compte anonymisé

Re : [Résolu] Aspirer un site web dans "un seul sens"

Merci beaucoup Brunod, en effet je n'avais pas cherché pour wget puisqu'au départ je ne m'orientais pas vers cette solution. Mais donc un

wget -np http://www.monsite.fr

me permettrait d'avoir ce que je veux alors ?

#6 Le 24/04/2013, à 15:53

Brunod

Re : [Résolu] Aspirer un site web dans "un seul sens"

Oups, celui-ci est mieux je pense :
http://forum.ubuntu-fr.org/viewtopic.php?id=78954%20!


Windows est un système d'exploitation de l'homme par l'ordinateur. Linux, c'est le contraire...
39 pc linux convertis

Hors ligne

#7 Le 24/04/2013, à 15:55

Compte anonymisé

Re : [Résolu] Aspirer un site web dans "un seul sens"

Super. Merci encore. Je passe en résolu et quand je récupérerai une machine sous Ubuntu je verrai si ça marche. smile