Forum Clubic

Récupérer contenu balise

Je viens de me rendre compte que l’exemple que j’avais donné n’était pas correct, je viens donc de l’éditer.

Bonjour, j’aimerais récupérer ce qui se trouve dans la balise

(son contenu).

Exemple : (exemple édité car erreur de ma part)


<div id="a">
    <div id="b">
      <div id="principal">
        <div>test</div>
        <p>blabla...</p>
        <div>test..</div>
      </div>
    </div>
</div>

(édité) Le problème est que la balise

est contenue à l’intérieur de deux autres balises (
et
), alors je me demande s’il serait possible d’extraire le contenu de la balise div “principal” avec une simple expression régulière.
Dans le cas où ce ne soit pas possible j’avais idée d’utiliser un parseur XML.
Edité le 09/03/2009 à 19:34

Il est clair qu’un parsage du document XML est la meilleure façon de faire (la plus propre).

Merci d’indiquer le(s) language(s) en jeu :jap: (HTML et Perl ?)

En fait c’est AutoIt que j’utilise comme language :ane: et je dois récupérer le code source d’une page en HTML, voire XHTML. Et concernant les expressions régulières qu’AutoIt utilise, c’est les PCRE (apparement).
Edité le 06/03/2009 à 23:22

Ah ouais… AutoIt… heu… bah c’est dommage parce que rien qu’en JavaScript c’est quand même assez simple.

Ben

/

(s:.+)
/

Vérifie pour le “s:”, ça devrait être PCRE_DOT_ALL pour prendre les sauts de lignes.

A vrai dire je viens de me rendre compte que mon exemple plus haut n’était pas bon. :ane: Je l’ai corrigé. Ce que je cherche à faire c’est en fait, récupérer le contenu d’un

qui est “encadré” par d’autres balises
.

Ah. Ben passe par DOM, même en php tu as getElementById -> fr2.php.net…

Oui, en php, javascript je sais que je pourrais passer par DOM pour récupérer le contenu de mon

, mais j’utilise AutoIt. Je sais que je peux utiliser le contrôle MSXML de microsoft pour parser du XML, et ensuite passer par DOM pour récupérer le contenu d’un élément. Par contre, dans mon cas, mon élément DIV se trouve dans une page HTML (et non XML) et visiblement MSXML ne fonctionnerait pas dans ce cas.
Enfin bref, ce n’est pas si grave, la question que je me posais était de savoir s’il était possible de récupérer l’élément
contenu à l’intérieur d’autres balises
(voir 1er message) avec une simple expression régulière. Mais apparement, si j’ai bien compris, c’est impossible.