Représentation des données
Comme nous le savons, l'apprentissage automatique consiste à créer un modèle à partir de données. Pour ce faire, l'ordinateur doit d'abord comprendre les données. Ensuite, nous allons discuter des différentes façons de représenter les données afin qu'elles soient comprises par l'ordinateur.
Données sous forme de tableau
La meilleure façon de représenter les données dans Scikit-learn est sous forme de tableaux. Un tableau représente une grille bidimensionnelle de données où les lignes représentent les éléments individuels de l'ensemble de données et les colonnes représentent les quantités liées à ces éléments individuels.
Exemple
Avec l'exemple donné ci-dessous, nous pouvons télécharger un ensemble de données sur l'iris sous la forme d'un DataFrame Pandas à l'aide de la bibliothèque python seaborn.
import seaborn as sns
iris = sns.load_dataset('iris')
iris.head()
Rendu
Besoin d'aide ?
Rejoignez notre communauté officielle et ne restez plus seul à bloquer sur un problème !