Contenu | Rechercher | Menus

Annonce

Si vous avez des soucis pour rester connecté, déconnectez-vous puis reconnectez-vous depuis ce lien en cochant la case
Me connecter automatiquement lors de mes prochaines visites.

À propos de l'équipe du forum.

#1 Le 28/09/2013, à 23:08

Le Barde

(RÉSOLU) Extraire un élément DOM d'un fichier HTML ?

Bonjour,

Dans mon projet je cherche à extraire l'élément ainsi que tous les sous-éléments d'un élément du DOM.

Par exemple en HTML5 : si j'ai un document avec deux sections ayant des ID #sectionA et #sectionB, je voudrais récupérer l'élément #sectionA, avec tous ses éléments enfants. En sortie j'ai donc un fichier ou une variable contenant le texte HTML correspondant au bout de document extrait...

Je n'ai pas encore choisi le langage à utiliser dans mon projet, c'est pourquoi je cherche toutes les solutions disponibles (mes préférées étant Dash, C, C++ et les langages de script classiques). Idéalement ce serait un petit programme appelable en Bash ou une lib...

Merci pour votre aide !

Dernière modification par Le Barde (Le 04/10/2013, à 12:28)

Hors ligne

#2 Le 28/09/2013, à 23:33

Haleth

Re : (RÉSOLU) Extraire un élément DOM d'un fichier HTML ?

Y'a plein de langages qui permettent de parser du XML, d'une manière ou d'une autre.
Tous, en fait;


Ubuntu is an ancien African word which means "I can't configure Debian"

Because accessor & mutator are against encapsulation (one of OOP principles), good OOP-programmers do not use them. Obviously, procedural-devs do not. In fact, only ugly-devs are still using them.

Hors ligne

#3 Le 29/09/2013, à 08:40

Le Barde

Re : (RÉSOLU) Extraire un élément DOM d'un fichier HTML ?

Le HTML n'est pas du XML, et je souhaite parser du HTML 4, du XHTML, du HTML5, le tout indifféremment. Logiquement la lib' doit reconnaître elle-même le type de langage de balisage dont il s'agit.

Hors ligne

#4 Le 29/09/2013, à 14:09

claudius01

Re : (RÉSOLU) Extraire un élément DOM d'un fichier HTML ?

Bonjour,

Si ce n'est pas du Xml, ..., bon courage ;-)


Cordialement, A+
--
Claudius

Dernière modification par claudius01 (Le 29/09/2013, à 18:59)

Hors ligne

#5 Le 29/09/2013, à 19:56

Le Barde

Re : (RÉSOLU) Extraire un élément DOM d'un fichier HTML ?

Bah... C'est une page web. Tous les navigateurs savent faire ce boulot, Firebug en est un bon exemple...

Hors ligne

#6 Le 04/10/2013, à 08:48

LapiGNU

Re : (RÉSOLU) Extraire un élément DOM d'un fichier HTML ?

Salut le Barde,

allez je m'y colle : en haut à droite de la page, il y a un champ de recherche. D'après le titre de ta question, essaye "extraire élément html". La première réponse renvoie à ce fil, la seconde à un cul-de-sac, et la troisième résout ton problème.

Bonne chance pour la suite de ton projet, et n'hésite pas à passer ce message en [Résolu] si c'est le cas !


frenchKISS sur www.tchitcha.info, Ubuntu clé en main pour les réseaux de postes de travail.
et surtout : Sauvez les arbres, mangez des castors. Sauvez les castors, ne mangez pas d'arbres !

Hors ligne

#7 Le 04/10/2013, à 12:28

Le Barde

Re : (RÉSOLU) Extraire un élément DOM d'un fichier HTML ?

Bonjour et merci de ta réponse.

J'ai trouvé. Au final, j'utiliserai Tidy pour convertir le HTML en un bon HTML valide avec XML (ce qui est le problème sinon). Ensuite, je parserai ça avec un parseur XML, ce qui se trouve à peu près à tous les coins de rue (probablement libxml). Une ressource ici : Parsing HTML with C. Ça me paraît le plus robuste et ça permet de naviguer dans le DOM (on ne sait jamais quel HTML on va avoir !)

Hors ligne