Détection d'anomalies
Introduction
La détection des anomalies est une technique utilisée pour identifier les points de données dans un ensemble de données qui ne correspondent pas au reste des données. Elle a de nombreuses applications dans le monde des affaires, comme la détection des fraudes, la détection des intrusions, le contrôle de la santé des systèmes, la surveillance et la maintenance prédictive. Les anomalies, également appelées valeurs aberrantes, peuvent être divisées en trois catégories, à savoir
- Point anomalies − Cela se produit lorsqu'une instance de données individuelle est considérée comme anormale par rapport au reste des données.
- Contextual anomalies − Ce type d'anomalie est spécifique au contexte. Elle se produit si une instance de données est anormale dans un contexte spécifique.
- Collective anomalies − Cela se produit lorsqu'une collection d'instances de données liées est anormale par rapport à l'ensemble des données plutôt que par rapport aux valeurs individuelles.
Methods
Deux méthodes, à savoir la détection des valeurs Outlier et la détection des Novelty , peuvent être utilisées pour la détection des anomalies. Il est nécessaire de faire la distinction entre ces deux méthodes.
Outlier detection
Les données de formation contiennent des valeurs aberrantes qui sont éloignées du reste des données. Ces valeurs aberrantes sont définies comme des observations. C'est la raison pour laquelle les estimateurs de détection des valeurs aberrantes essaient toujours de s'adapter à la région présentant les données d'apprentissage les plus concentrées tout en ignorant les observations déviantes. Cette méthode est également connue sous le nom de détection d'anomalie non supervisée.
Besoin d'aide ?
Rejoignez notre communauté officielle et ne restez plus seul à bloquer sur un problème !