Dans le cadre de ses activités, notre client recherche un Data Engineer (spécialisé en solution IA) pour rejoindre son Centre d'Excellence pour l'IA Générative.
Contexte
Notre client explore des projets d'IA à différents niveaux, notamment l'assistance bureautique pour les employés, les chatbots utilisant la génération augmentée par la récupération (RAG), ainsi que des initiatives plus d'automatisation plus transformationnelles.
Mission
L'objectif de cette mission est de contribuer à la transformation des processus métier à travers des projets avancés en jouant pour soutenir les initiatives stratégiques et opérationnelles en IA générative :
* Gestion des pipelines de données (ETL/ELT), leur transformation et leur optimisation qui sont critiques pour les projets IA générative
* Préparation des données et utilisation des plateformes (Azure Fabric, Data Factory, Synapse, etc.) pour garantir un flux de données optimisé
* Coordination avec la data factory interne (dans un modèle hub & spoke) qui impliquera de travailler avec des dépendances limitées
Responsabilités
Le candidat sélectionné devra, en partenariat avec le Solution Architect et l'expert IA participer à la conception, au déploiement, à l'optimisation et au monitoring des solutions d'IA générative. Son rôle sera en particulier de :
* Construire, optimiser et maintenir des pipelines ETL/ELT
* Gérer les flux de données, leur transformation et leur intégration dans des workflows IA
* Superviser la qualité, la sécurité, et la gouvernance des données (ex : Azure Purview, RGPD)
* Créer des dashboards de monitoring pour analyser les performances et optimiser les coûts
* Garantir la scalabilité, la sécurité, et la fiabilité des solutions déployées
*
Profil recherché
Nous recherchons un Data Engineer spécialisé en IA et Azure avec une expérience significative dans des projets d'envergure en IA générative. Le candidat idéal doit adopter une démarche proactive d'apprentissage continu et d'innovation dans le domaine.
Il faut avoir :
* 2 à 3 ans d'expérience en CI/CD pour pipelines (Azure DevOps, GitHub, automatisation des déploiements/tests)
* 3 à 5 ans d'expérience en gestion et transformation des données (ETL/ELT, Azure Data Factory, Synapse, Fabric, Databricks)
* 3 à 5 ans d'expérience en stockage et gouvernance des données (Data Lakes, Data Lakehouses, Azure Purview, RGPD)
* Un niveau de français C2 et anglais B1 (CEFR)
Cela serait également intéressant si vous avez :
* 2 à 3 ans d'expérience en Cloud et Infrastructure-as-Code (TerraForm, gestion des ressources Azure)
* 2 à 3 ans d'expérience en connaissance des processus AI (Training, fine-tuning, inference, LLMs, gen IA, Prompting, Openai)
* 1 à 2 ans d'expérience en Monitoring et observabilité (Azure Monitor, Log Analytics, Grafana, Opentelemetry)
* 3 à 5 ans d'expérience en Python et SQL
Pour réussir dans ce poste, vous devez avoir :
* Une bonne autonomie
* Une capacité à travailler en équipe
* *