Représentation des données

15 min Niveau 2

Comme nous le savons, l'apprentissage automatique consiste à créer un modèle à partir de données. Pour ce faire, l'ordinateur doit d'abord comprendre les données. Ensuite, nous allons discuter des différentes façons de représenter les données afin qu'elles soient comprises par l'ordinateur.

Données sous forme de tableau

La meilleure façon de représenter les données dans Scikit-learn est sous forme de tableaux. Un tableau représente une grille bidimensionnelle de données où les lignes représentent les éléments individuels de l'ensemble de données et les colonnes représentent les quantités liées à ces éléments individuels.

Exemple

Avec l'exemple donné ci-dessous, nous pouvons télécharger un ensemble de données sur l'iris sous la forme d'un DataFrame Pandas à l'aide de la bibliothèque python seaborn.

import seaborn as sns
iris = sns.load_dataset('iris')
iris.head()

Rendu

logo discord

Besoin d'aide ?

Rejoignez notre communauté officielle et ne restez plus seul à bloquer sur un problème !

En savoir plus