Recherche dans l'arbre
Il existe de nombreuses méthodes de Beautifulsoup, qui nous permettent de rechercher un arbre d'analyse. Les deux méthodes les plus courantes et les plus utilisées sont find()
et find_all()
.
Avant de parler de find()
et find_all()
, voyons quelques exemples de différents filtres que vous pouvez passer dans ces méthodes.
Types de filtres
Nous disposons de différents filtres que nous pouvons passer dans ces méthodes. La compréhension de ces filtres est cruciale car ils sont utilisés à maintes reprises dans l'API de recherche. Nous pouvons utiliser ces filtres sur la base du nom de la balise, de ses attributs, du texte d'une chaîne ou d'un mélange de ces éléments.
Une String
L'un des types de filtre les plus simples est une chaîne de caractères. En passant une chaîne à la méthode de recherche, Beautifulsoup effectuera une correspondance avec cette chaîne exacte.
Le code ci-dessous trouvera toutes les balises <p>
dans le document.
>>> markup = BeautifulSoup('<p>Top Three</p><p><pre>Programming Languages are:</pre></p><p><b>Java, Python, Cplusplus</b></p>')
>>> markup.find_all('p')
[<p>Top Three</p>, <p></p>, <p><b>Java, Python, Cplusplus</b></p>]
Regular Expression
Besoin d'aide ?
Rejoignez notre communauté officielle et ne restez plus seul à bloquer sur un problème !