Dans le cadre de ses activités, notre client est à la recherche d'un Data Engineer (spécialisé en solution IA).
Il s'agit d'une mission à temps plein dont la durée est estimée à 12 mois renouvelables et qui débutera idéalement en février.
Une partie de la mission peut, en concertation avec le responsable, se faire en télétravail mais une présence sur le site de Gosselies de minimum 2 jours par semaine est obligatoire. Des jours supplémentaires de présence sur site peuvent éventuellement être demandés au consultant, en fonction des besoins du service (de manière ponctuelle). Le site de Gosselies n'étant pas facilement accessible en transports en commun, la possession d'un permis de conduire et d'un véhicule sera préférable pour les déplacements.
Conscient de l'impact profond que l'intelligence artificielle aura sur le monde du travail, notre client explore des projets d'IA à différents niveaux, notamment l'assistance bureautique pour les employés, les chatbots utilisant la génération augmentée par la récupération (RAG), ainsi que des initiatives plus d'automatisation plus transformationnelles.
Pour naviguer dans cet environnement en évolution, le client vise à établir un Centre d'Excellence pour l'IA Générative et cherche actuellement son premier membre d'équipe pour participer au développement de divers PoC, pilotes et projets.
Dans ce contexte, notre client recherche un Data Engineer spécialisé en IA et Azure pour rejoindre son centre de compétence IA générative afin de contribuer à la transformation des processus métier à travers des projets avancés en jouant pour soutenir les initiatives stratégiques et opérationnelles en IA générative:
La gestion des pipelines de données (ETL/ELT), leur transformation et leur optimisation qui sont critiques pour les projets IA générative
La préparation des données et l'utilisation des plateformes (Azure Fabric, Data Factory, Synapse, etc.) pour garantir un flux de données optimisé
La coordination avec la data factory interne (dans un modèle hub & spoke) qui impliquera de travailler avec des dépendances limitées
Ce poste exige une expertise technique solide et une expérience significative dans des projets d'envergure en IA générative, essentielle pour établir la base de l'équipe IA générative du client. Le candidat idéal doit adopter une démarche proactive d'apprentissage continu et d'innovation dans le domaine.
Responsabilités
Le candidat sélectionné devra, en partenariat avec le Solution Architect et l'expert IA participer à la conception, au déploiement, à l'optimisation et au monitoring des solutions d'IA générative. Son rôle sera en particulier de:
Construire, optimiser et maintenir des pipelines ETL/ELT
Gérer les flux de données, leur transformation et leur intégration dans des workflows IA
Superviser la qualité, la sécurité, et la gouvernance des données (ex : Azure Purview, RGPD)
Créer des dashboards de monitoring pour analyser les performances et optimiser les coûts
Garantir la scalabilité, la sécurité, et la fiabilité des solutions déployées
Développer des pipelines CI/CD robustes pour les déploiements IA
Profil recherché
Must have:
CI/CD pour pipelines : 2 à 3 ans d'expérience (Azure DevOps, GitHub, automatisation des déploiements/tests)
Gestion et transformation des données: 3 à 5 ans d'expérience (ETL/ELT, Azure Data Factory, Synapse, Fabric, Databricks)
Stockage et gouvernance des données: 3 à 5 ans d'expérience (Data Lakes, Data Lakehouses, Azure Purview, RGPD)
Exigence linguistique : Niveau de français C2 et anglais B1 (CEFR)
Should have:
Cloud et Infrastructure-as-Code : 2 à 3 ans d'expérience (TerraForm, gestion des ressources Azure)
Connaissance des processus AI : 2 à 3 ans d'expérience (Training, fine-tuning, inference, LLMs, gen IA, Prompting, Openai)
Monitoring et observabilité : 1 à 2 ans d'expérience (Azure Monitor, Log Analytics, Grafana, Opentelemetry)
Python et SQL : 3 à 5 ans d'expérience
Nice to have:
Azure AI eco-system : 1 à 2 ans d'expérience (AI Foundry, AI Studio, AI Search, Cognitive Search, AI Services)
Intégration avec MLOps : 1 à 2 ans d'expérience (Langchain, Prompt Flow)
Orchestration : 1 à 2 ans d'expérience (Docker, Kubernetes)
Compétences générales :
Autonomie, travail en équipe, bonne communication
Collaboration avec équipes multidisciplinaires
Esprit innovant pour proposer des solutions adaptées aux besoins métier
Soft skills:
Autonome, capable de travailler en équipe et de communiquer
Rigoureux
Proactif
Orienté solutions