Alternance Data engineer - Paris (F/H) (H/F)
Description du poste
Au sein de l'équipe Ingénierie des Données, vous aurez pour mission de contribuer à la conception, au développement et à la fiabilisation des pipelines de données alimentant l'Entrepôt de Données de Santé (EDS), afin d'en garantir la qualité et la disponibilité pour les chercheurs et les professionnels de santé.Dans le cadre de votre apprentissage, vous serez amené·e à travailler sur des projets impliquant :L'intégration de sources de données hétérogènes issues du Système d'Information hospitalier,Le traitement et la transformation de volumes massifs de données de santé,L'industrialisation et le monitoring de traitements au sein d'une plateforme Big Data.Vous travaillerez en étroite collaboration avec les équipes de data science et d'analyse des données pour garantir la fiabilité, la performance et la traçabilité des solutions développées. En vous appuyant sur les pipelines et les projets déjà en place, les missions principales de l'apprentissage seront :Développer et maintenir des jobs Spark (Scala et/ou Python) pour l'intégration, la transformation et la mise en qualité des donnéesContribuer à l'orchestration des pipelines de données avec Apache Airflow (conception de DAGs, gestion des dépendances, monitoring)Participer au déploiement et à l'exploitation des traitements sur Kubernetes (configuration Helm, debugging, gestion des ressources)Contribuer à l'optimisation des requêtes et des modèles de donnéesMettre en place et maintenir des tests automatisés sur les données et les pipelinesParticiper aux pratiques DevOps de l'équipe : intégration continue sur GitLab, revues de code, déploiement via ArgoCDDocumenter les traitements, les schémas de données et les procédures d'exploitationUne attention particulière sera portée à la qualité du code produit, au respect des bonnes pratiques d'ingénierie logicielle (tests, documentation, revue de code) et à la capacité à travailler dans un environnement collaboratif. Des objectifs annuels précis seront établis avec le maître d'apprentissage.
Données marché — Data engineer
Données non disponibles
postes prévus (BMO 2025)