Data Scientist

8 min

Le big data est une richesse à condition de donner du sens et de la valeur aux données collectées. C’est le rôle du data scientist de les trier et de les interpréter pour qu’elles servent au pilotage de l’entreprise.

Pour rappel, le big data est l’ensemble des données numériques récupérées par les sites web, les applications, les capteurs physiques, les réseaux sociaux… Il peut s’agir d’informations écrites mais aussi de vidéos, d’images. L’intelligence artificielle se nourrit de la data pour accroître ses performances.

Présentation

Le data analyst et le data scientist sont responsables du croisement des données de l'entreprise avec celles mises à disposition via les services web et autres canaux digitaux (téléphone mobile..). Leur objectif : donner du sens à ces données et en extraire de la valeur pour aider l'entreprise à prendre des décisions stratégiques ou opérationnelles.

Dans ce cadre, ils conçoivent les modèles et algorithmes pour collecter, stocker, traiter et restituer les données. C'est justement cette forme de "créativité" qui distingue le data analyst et le data scientist du pur statisticien : ils sont capables d'imaginer de nouveaux modèles d'analyse pour traiter des données brutes et hétérogènes qui ne peuvent pas être analysées à l'aide d'outils classiques de gestion de bases de données.

Le data scientist est le profil le plus large dans les métiers de la data. On l’appelle aussi chief data scientist ou dataminer. Sa vocation est d’exploiter les mégadonnées une fois récupérées, stockées et nettoyées par le data engineer : les trier, les structurer, en extraire les plus utiles et faire des prévisions. Il s’occupe de choisir les outils d’acquisition des données, les algorithmes de tri et d’interprétation, ainsi que les solutions de conservation (data warehouse).

Son travail est absolument utile à la direction d’une entreprise puisque la data donne des orientations fonctionnelles et stratégiques (RH, gestion, marketing…).

Par exemple, dans le secteur des télécommunications, grâce aux indicateurs de consommation et aux prévisions, le service commercial est en mesure de proposer des forfaits personnalisés.

Souvent confondu avec le data analyst - spécialisé dans une catégorie de données autour d’une question business ou stratégique - le data scientist a une vision plus globale et un rôle plus transversal.

Tâches

Dans de petites entreprises, le data scientist est amené à tenir d’autres rôles comme celui de data miner et de data analyst. Il peut également faire partie d’une société de services, comme une SSII.

Dans une entreprise de plus grande taille, il travaille avec l’équipe big data. Devenir scrum master, c'est-à-dire chef de projet en big data est une des évolutions possibles. L’encadrement d’une équipe et d’un service est une suite logique dans sa carrière. L’entrepreneuriat en tant que consultant en est une autre.

Rôles

Le data scientist intervient sur de nombreux sujets et dans des domaines divers et variés : énergie, télécommunications, médias, musique, mode, banque, assurance, tourisme, médical, transport, finance, agriculture… Le big data est un véritable raz de marée pour tous les secteurs, qui ont bien compris ses enjeux stratégiques et financiers.

Salaires

Le salaire d'un data analyst débutant oscille entre 35 K€ et 38 K€. Après 4 ans d'expérience, il peut atteindre 45 à 55 K€.

Formation

Un Bac + 4 ou Bac + 5 en informatique, management, statistiques ou en marketing est indispensable pour occuper ce poste. Quelques formations de niveau bac + 3 permettent d'occuper des postes d'assistant. Les formations qui permettent de se former au métier de la big data sont encore peu nombreuses mais elles se mettent en place rapidement pour faire face à la demande.

Niveau bac + 3

  • BUT informatique
  • Licence professionnelle métiers de l'informatique : systèmes d'information et gestion de données. Différents parcours : infrastructures stockage et analyse de données massives - big data (Université de Bourgogne)
  • Licence professionnelle métiers du décisionnel et de la statistique. Différents parcours : data mining ou applications aux domaines de la santé (Paris Descartes), ingénierie de données (Université de Pau)

Niveau bac + 5

  • Master MIAGE - méthodes informatiques appliquées à la gestion des entreprises. Différents parcours : big data décisionnel et apprentissage / data science (Université de Rennes)
  • Master informatique. Différents parcours : optimisation et recherche opérationnelle (université de Nantes), machine learning and data mining (université de Saint Etienne), données et systèmes connectés (université de Saint-Etienne), big data (université de Cergy), intelligence artificielle embarquée (université de Cergy), data mining (université de Lyon 2), MIASHS : big data et fouille de données (Paris 8), master of science in informatics - MOSIG (Ensimag), gestion des données et extraction de connaissances à large échelle (université de Paris Saclay)
  • Master SIAD - systèmes d'information et d'aide à la décision. Différents parcours : data sciences, business intelligence
  • Master mathématiques. Différents parcours : statistiques pour l’évaluation et la prospective (université de Reims-Champagne Ardennes),
  • Master mathématiques et applications. Différents parcours : statistiques appliquées et analyse décisionnelle - SAAD (université de Caen), méthodes stochastiques et informatiques pour la décision - MSID (université de Pau et des pays de l'Adour), master of science in industrial and applied mathematics - MSIAM (Ensimag)
  • Master MIASHS - mathématiques appliquées aux sciences humaines et sociales
  • Master sciences des données
  • Master méga données et analyse sociale - Medas (Cnam - INTD)
  • Mastère spécialisé en big data (ESGI, Grenoble Ecole de management),
  • MSc (master of sciences) : statistics for smart data (Ensai), big data for business (Ecole polytechnique – HEC), data sciences & - business analytics (Centrale Supelec - Essec Business School), applied data science & big data (Data science institute), data science (Ensae ParisTech), data management (PSB),
  • Diplôme d’ingénieur avec spécialisation big data :
    • IAMD – ingénierie et applications des masses de données (Télécom Nancy),
    • big data & data science (Mines Nancy),
    • data science (Ensae ParisTECH),
    • ingénierie des systèmes d'information (Grenoble INP Ensimag)
    • autres écoles : Isep

Niveau bac + 6

Mastère spécialisé (MS) :

  • Big data - gestion et analyse des données massives (Télécom ParisTech),
  • Big data : analyse management et valorisation responsable (Ensimag + EMSI Ecole de management de Grenoble)
  • Data Science (ENSAE)
  • Expert en sciences des données (Insa Rouen Normandie)