Qu’est-ce qu’un Data Scientist ?
Data
Quel est le rôle du Data Scientist ?
Une fois la data récoltée, transformée et formatée par le Data Engineer, le Data Scientist les valorise par la conception d’algorithme qui serviront ensuite étudier des comportements et à élaborer des modèles prédictifs accompagnant la prise de décision stratégiques des équipes métiers et de la direction.
Son objectif est de traiter un énorme volume de données pour en faire une analyse pertinente car basée sur la data.
Pourquoi les entreprises ont besoin d'un Data Scientist ?
La data parle d’elle-même et donnera raison à celui ou celle qui l’utilisera. Se baser sur la data, c’est s’assurer de prendre une décision sur un échantillon gigantesque qu’aucun groupe de collaborateurs, sondage ou étude ne saura couvrir.
Plus elles récoltent ou récupèrent de la data, plus elles auront besoin de data scientist pour la traiter et la valoriser, que ça soit pour la prise de décision interne ou pour améliorer son produit en le rendant plus performant grâce à la prédiction.
En soi, le data scientist est le nouveau mathématicien/statisticien dans l’ère de la tech.
La collaboration dans l'équipe
Dans une petite équipe tech, il peut porter la responsabilité d’un pôle data en confondant les métiers de Data Engineer et Data Analyst. Il aura ainsi la main sur tout le cycle de valorisation de la donnée sans pour autant pouvoir aller profondément dans ses sujets.
Cela nécessite une connaissance horizontale des problématiques data sans pouvoir développer une expertise verticale.
Dans une grande équipe tech, il travaille sous la responsabilité d’un Manager Data (Head of Data, CDO, Lead Data Manager), en collaboration le Data Engineer qui lui fournit un volume de données dites “propres” prêtes à être utilisées.
Le Data Analyst qui peut être amené à travailler sur les mêmes problématiques de prise décisions mais avec un rendu différent. Le Data Analyst développera des outils visuels (dashboard) et de reporting, là où le Data Scientist mettra en place des modèles prédictifs.
Hors pôle data, il peut également être rattaché à la direction d’une équipe métier afin de travailler sur leurs problématiques en contact direct avec les équipes.
Quelles sont les problématiques du Data Scientist ?
Il va travailler sur :
- Prise de décision : étudier la probabilité de réussite sur un nouveau marché en comparant les risques et aux bénéfices (banques et assurances), déterminer le type de profil qui reste et s’épanouisse dans son entreprise à travers des modèles prédictifs pour optimiser son recrutement (tests psychologiques), étudier la meilleure disposition d’un champ d’éolienne pour obtenir le meilleur rendement possible.
- Améliorer son produit/service : analyser le comportement de ses clients pour prédire leur prochain achat ou étudier le comportement d’un utilisateur pour faire évoluer une feature inutilisée/mal utilisée.
- Data science en tant que technologie : reconnaissance faciale sur son smartphone ou audio pour reconnaître une musique, traitement et correction d’image/photo pour automatiser des tâches redondantes, chronophages et fastidieuses, optimisation d’itinéraire selon son moyen de transport ou encore recommandation de contenu selon ses précédents choix (articles de presse, chanson et films sur plateformes streaming).
Technologies & plateformes utilisées
- Langage BDD : SQL, NoSQL
- Gestion de BDD : MongoDB, Cassandra, Hbase
- Gestion & visualisation de données : Power BI, Suite Elastic, Tableau
Pour la programmation, voici les langages et frameworks utilisés :
- Langage : R, Python, Java + Scala, C++
- Framework Big DataSpark : Hadoop, Hive
Il utilise des librairies comme TensorFlow (Deep Learning) avec Python.
Il a des compétences Cloud : Microsoft Azure, AWS, GCP.
Il connaît très bien aussi le Web Analyse : Omniture, Google Analytics.
Quelles sont les formations pour devenir Data Scientist ?
Pour prétendre à ce poste il faut avoir suivi des formations en :
- Ecole d’ingénieur
- Cursus universitaire spécialisé en informatique et statistiques, Big Data Analyse, management, statistiques.
Une compréhension et une maîtrise des mathématiques appliquées aux statistiques et probabilité est primordiale.
Quel est le salaire d'un Data Scientist ?
Le salaire d'un Data scientist commence à 35K/an et peut aller jusqu'à 100K€ brut /an. Ils ont des salaires confortables avec une belle évolution toute au long des années :
Data Scientist Junior : 35 à 50 k€
Data Scientist Intermédiaire : 45 à 65 k€
Data Scientist Senior : 60 à +100 k€.
Comment peut évoluer une carrière d'un Data Scientist ?
Le Data Scientist peut évoluer vers des métiers de management ou d'expertise :
- Management : Lead Data Scientist, Head of Data, Chief Data Officer
- Expertise : expert Big Data, Consultant senior Data Science / Big Data.