Plateforme data temps réel
confidentielArchitecture CDC complète pour données sécurité en entreprise — réplication temps réel vers base analytique, orchestration des pipelines ML, exposition via API REST.
// Data Engineer · Clermont-Ferrand
Je conçois et déploie des architectures data robustes — pipelines temps réel, orchestration, et APIs analytiques — qui transforment des données brutes en valeur opérationnelle.
// 001
Data Engineer
2024 → présent
Sep 2022 → 2024
Alternant Data Engineer
Stagiaire Data Scientist
Mai → Août 2022
Avr → Jun 2021
Stagiaire Développeur IA
2024 → présent
Data Engineer
Sep 2022 → 2024
Alternant Data Engineer
Mai → Août 2022
Stagiaire Data Scientist
Avr → Jun 2021
Stagiaire Développeur IA
// 002
Réalisations en production et académiques
Architecture CDC complète pour données sécurité en entreprise — réplication temps réel vers base analytique, orchestration des pipelines ML, exposition via API REST.
Pipeline cloud AWS end-to-end pour prédire la qualité de l'air future à partir de données environnementales — ingestion S3, traitement EMR, modèle SageMaker, restitution Quicksight.
Modèle ML pour prédire le besoin en prothèse auditive à partir d'examens tonaux — pipeline Kedro reproductible, tracking MLflow, containerisation Docker.
Système d'optimisation de grappes par algorithmes IA pour centrale nucléaire — implémentation de la recherche par faisceau (beam search). Projet de recherche académique UNICAEN.
// 003
Technologies maîtrisées en production
Ingestion & Streaming
Traitement
Orchestration
Cloud
Stockage
DevOps & MLOps
Langages
BI & Visualisation
// 004
Pas en recherche active, mais toujours ouvert à un échange intéressant
Téléphone
07 55 96 25 19Localisation
Clermont-Ferrand, Auvergne-Rhône-Alpes
Disponibilité
Ouvert aux opportunités CDI