Data Scientist en alternance
Description du poste
Au sein de la section « DATA SCIENCES» du Pôle Données de la DTNUM apporte l’IA à la DGFiP par trois moyens :
• Accès direct par API pour les développeurs à notre plateforme GPU/LLM on premise
• Développement d’un Assistant IA avec IHM utilisable par les personnes non techniques (chat, RAG, autres cas en développement)
• Accompagnement sur-mesure de bureaux métiers et expérimentations sur leurs cas d’usage
Le Data Scientist en alternance pourra réaliser ces expérimentations en contact avec les bureaux métiers de la DGFiP. Les expérimentations réussies sont mises en production directement au sein des applications de la DGFiP où intégrées dans l’Assistant IA comme étant des fonctionnalités à part entière.
Les projets historiques du Pôle IA comportent notamment Llamendement (résumés et attribution automatique d’amendements) ou Foncier Innovant (détections de piscines taxables par imagerie aérienne).
Les travaux actuels portent sur plusieurs champs :
• Amélioration du moteur de recherche impots.gouv par embedding et ajouts de résumés,
actuellement en production, ajout d’une génération de réponse pour compléter le RAG en cours de construction
• Utilisation de modèles VLM/OCR pour le traitement des nombreux documents papiers de la DGFiP : reconnaissance et extraction d’information, OCRisation, classification d’images
• Assistance aux métiers juridiques par IA
• Mise en place d’un pipeline Airflow de récupération et de vectorisation des bases documentaires pour le RAG de l’Assistant IA
• Travaux sur le remplacement du chatbot sur l’ENSAP
• Mise à disposition de l’IA pour les métiers de développeurs à la DGFiP
• Travaux exploratoires autours de la génération de réponses se basant sur des données fiscales personnelles, via MCP
• Développements de capacités agentiques pour aider le contribuable à réaliser des actions une fois authentifié
Données marché — Data scientist
Cadres administratifs, comptables et financiers (hors juristes)
Médian : 3 200 €
postes prévus (BMO 2025)