Beautiful Objects
Introduction
Le point de départ de tout projet BeautifulSoup est l'objet BeautifulSoup. Un objet BeautifulSoup représente le document HTML/XML d'entrée utilisé pour sa création.
Nous pouvons passer soit une chaîne de caractères ou un objet de type fichier pour BeautifulSoup, où les fichiers (objets) sont soit stockés localement dans notre machine ou une page web.
Les objets BeautifulSoup les plus courants sont les suivants -
- Tag
- NavigableString
- BeautifulSoup
- Comment
Comparaison de l'égalité des objets
Selon la belle soupe, deux objets chaîne ou balise navigable sont égaux s'ils représentent le même balisage HTML/XML.
Voyons maintenant l'exemple ci-dessous, où deux balises <b>
sont comparées, même s'ils sont chacun dans des parties différentes de l'arbre et si leur contenu sont similaires.
>>> markup = "<p>Learn Python and <b>Java</b> and advanced <b>Java</b>! from Microlead</p>"
>>> soup = BeautifulSoup(markup, "html.parser")
>>> first_b, second_b = soup.find_all('b')
>>> print(first_b == second_b)
True
>>> print(first_b.previous_element == second_b.previous_element)
False
Cependant, pour vérifier si les deux variables se réfèrent aux mêmes objets, vous pouvez utiliser la méthode suivante-.
>>> print(first_b is second_b)
False
Besoin d'aide ?
Rejoignez notre communauté officielle et ne restez plus seul à bloquer sur un problème !