Aller au contenu

Diplôme · NIVEAU 7

Concepteur manager des infrastructures de données massives

Diplôme de type Diplôme

Nb formations1 formations
NiveauDiplôme
Présentation

Le diplôme en bref

La certification « Concepteur-Manager des infrastructures de données massives » prépare le titulaire à l’exercice d’activités requérant des savoirs et savoir-faire techniques et technologiques hautement spécialisés dans le domaine de la conception et du management de solutions pour l’extraction, le traitement et l’entreposage de données massives. Ces professionnels interviennent en amont des Data scientistes et des Data analystes avec lesquels ils sont amenés à collaborer activement. Le rôle des titulaires de la certification consiste à concevoir puis développer les infrastructures ou pipeline de données et déployer ensuite des solutions techniques robustes qui permettent aux utilisateurs d’accéder à des données pertinentes et fiables via des plateformes logicielles et des outils d’interface (API). Ces données serviront à éclairer les analyses et les prises de décision métiers (Direction Générale, Marketing, Finances, RH, logistique, ...).

Activités visées

* Veille scientifique, technologique et règlementaire, identification de l’état de l’art des outils et plateformes logiciels ETL * Spécification des besoins et dimensionnement des infrastructures de données massives dans une perspective pluriannuelle * Evaluation et sélection d’une solution ETL globale incluant des développements en propre, des plateformes logicielles et des API disponibles sur le marché * Développement d’une infrastructure et management des flux et des stocks de données dans le respect du RGAA et du RGPD * Identification et sélection des solutions data lake les plus performantes sur le marché * Déploiement d’outils d’extraction et de stockage de données brutes en interne ou dans le cloud * Management des opérations de traitement des données brutes avant stockage dans un data lake * Supervision de la rédaction des documents supports à l’utilisation des outils et plateformes logicielles * Management de la mise en place des bases de données internes et externes dans le respect du RGPD et des critères du RGAA * Evaluation et sélection d’une solution de traitement et d’entreposage des données * Déploiement des processus de traitement et de formatage des données brutes pour entreposage * Mise à disposition de données fiables et pertinentes pour les utilisateurs * Elaboration d’un guide d’utilisation des plateformes et des API déployées * Elaboration d’un cahier des charges technique et fonctionnel répondant aux besoins des scientistes et des analystes * Pilotage du développement d’API, de requêtes et de routines automatisées avec implication de l’ensemble des parties prenantes * Anticipation des besoins utilisateurs et amélioration continue des plateformes logicielles ETL * Mise en œuvre d’indicateurs de performance des projets sur l’ensemble de leur cycle de vie * Management des processus d’automatisation et de fiabilisation des infrastructures, des plateformes et des interfaces * Contribution à l’amélioration de la qualité des données mises à dispositions des utilisateurs * Conception et mise en œuvre de Tests d’intégration avant déploiement d’algorithmes d’IA, de nouvelles plateformes logicielles ou d’API

Coût de formation

Frais de scolarité

Information

Renseignez-vous auprès de l'établissement pour connaître les frais précis. Les tarifs varient selon le statut (public, privé) et le mode de formation (initial, alternance).

Profil RIASEC

Le profil type

100%I

Investigateur

Analytique, recherche, science

93%R

Réaliste

Manuel, pratique, technique

3%A

Artistique

Créatif, expression, design

Où étudier

Où préparer ce diplôme