Illustration métier Data engineer

Collecter des données c’est bien. Pouvoir les stocker, les rendre fiables et les analyser, c’est mieux ! Pour ce faire, les entreprises ont besoin d’experts alliant compétences techniques et compréhension des enjeux business : les Data Engineers.

MISSIONS

Un Data Engineer est quelqu’un ayant un background technique (en développement logiciel le plus fréquemment). Il va construire l’architecture du système Big Data et doit s’assurer de pouvoir collecter, transformer et stocker les données de différentes sources. Pour cela, il développe des solutions qui permettent de traiter un gros volume de data dans un temps limité. 

Le travail d’un Data Engineer est de préparer le terrain pour qu’un Data Scientist puisse se servir des données «propres» afin de les exploiter de façon plus complexe, tirer des tendances (Insights), prédire, inférer avec les algorithmes de Machine Learning.

Le Data Engineer va construire l’architecture du système Big Data. Il optera pour des outils de stockage adaptés au type de données et au ratio stockage/query.

Avec un intérêt pour le Développement et Opérations (DevOps), il est en collaboration directe avec les autres rôles de la data. Il sait doser l’aspect mise en production avec les itérations rapides du développement.

Les principaux enjeux auxquels il fait face sont : la performance, la scalabilité et la gestion de gros volumes de données.

COLLABORATION DANS L’EQUIPE

  • Machine Learning Engineer
  • Data Scientist
  • Devops

COMPÉTENCES

Il utilise la plupart du temps des bases de données NoSQL et se basera sur le cloud pour les infrastructures. Il sait également employer les technologies comme le Airflow et Spark pour orchestrer et traiter convenablement ces grands volumes de données. De manière générale le Data Engineer a un background de développeur. Afin de proposer les meilleures solutions, c’est un développeur applicatif avec une appétence pour l’administration des infrastructures informatiques.

Pour résumer, le Data Engineer est un profil tech qui s’est spécialisé dans la création de solutions logicielles autour du big data.

SOFT SKILLS

Rigueur, curiosité, communication et esprit d’équipe sont les éléments clefs pour être un bon Data Engineer.

TECHNOLOGIES

Python, Scala, Kafka, SQL, NoSQL, Map/Reduce, Hadoop, HiveData Lake, Big Data, Spark, Airflow, Software Engineering, orchestration de workflows, cloud.

LA FORMATION

La majorité des Data Engineers ont un parcours en école d’ingénieur spécialisée en informatique ou bien un Master Big Data à l’Université. Certains Data Engineers sont aussi d’anciens Software Engineers (Ingénieurs logiciel) ou Ingénieurs Big Data.

LE SALAIRE

EVOLUTION DE CARRIÈRE

Lead Data Engineer, Head of Data, ML Engineer, Data Scientist

Catégories