Aboubacar_Me contacter

// Data Engineer · Clermont-Ferrand

Aboubacar Camara

Je conçois et déploie des architectures data robustes — pipelines temps réel, orchestration, et APIs analytiques — qui transforment des données brutes en valeur opérationnelle.

3+ans en production
<1slatence CDC
100+utilisateurs déployés
3systèmes en prod simultanément

// 001

Expériences

2024 → présent

CikabaCDI

Data Engineer

  • Système CDC temps réel Debezium + RabbitMQ — latence < 1s
  • API analytique en production (100+ utilisateurs actifs)
  • Orchestration Airflow : pipelines traitement + entraînement ML
DebeziumRabbitMQAirflowAPI REST

Sep 2022 → 2024

CikabaAlternance

Alternant Data Engineer

  • Traitement de données massives accidents du travail avec Spark
  • Pipelines Airflow pour données d'accueil sécurité entreprises
  • Collaboration équipe IA : Data Scientists, Analysts, Dev
SparkAirflowPythonSQL

Mai → Août 2022

CikabaStage

Stagiaire Data Scientist

  • Déploiement de modèles ML en production
  • Préparation des données et dashboards analytiques
PythonPandasPower BI

Avr → Jun 2021

Laboratoire UNICAENStage

Stagiaire Développeur IA

  • Optimisation de grappes de centrale nucléaire par algorithmes IA
  • Implémentation de la recherche par faisceau (beam search)
PythonJavaBeam Search

// 002

Projets

Réalisations en production et académiques

Plateforme data temps réel

confidentiel

Architecture CDC complète pour données sécurité en entreprise — réplication temps réel vers base analytique, orchestration des pipelines ML, exposition via API REST.

< 1s latence CDC100+ utilisateurs3 systèmes prod
DebeziumRabbitMQSparkAirflowAPI REST
Code confidentiel

Prédiction qualité de l'air

Pipeline cloud AWS end-to-end pour prédire la qualité de l'air future à partir de données environnementales — ingestion S3, traitement EMR, modèle SageMaker, restitution Quicksight.

AWS end-to-endESGI 2024
S3LambdaEMRSageMakerQuicksight
GitHub à venir

Prédiction prothèse auditive

Modèle ML pour prédire le besoin en prothèse auditive à partir d'examens tonaux — pipeline Kedro reproductible, tracking MLflow, containerisation Docker.

MLOps completESGI 2024
KedroMLflowDockerPython
GitHub à venir

Optimisation IA — Centrale nucléaire

Système d'optimisation de grappes par algorithmes IA pour centrale nucléaire — implémentation de la recherche par faisceau (beam search). Projet de recherche académique UNICAEN.

Recherche académiqueUNICAEN 2021
PythonJavaBeam Search
GitHub à venir

// 003

Stack technique

Technologies maîtrisées en production

Ingestion & Streaming

KafkaDebeziumRabbitMQCDC

Traitement

Apache SparkHadoopPythonPandasScala

Orchestration

Apache AirflowKedroTalend

Cloud

AWS S3AWS LambdaAWS EMRAWS SageMakerAzureSnowflake

Stockage

SQLNoSQL

DevOps & MLOps

DockerTerraformGitHubMLflowAPI REST

Langages

PythonJavaScalaSQL

BI & Visualisation

Power BITableauDashQuicksight

// 004

Contact

Pas en recherche active, mais toujours ouvert à un échange intéressant

Téléphone

07 55 96 25 19

Localisation

Clermont-Ferrand, Auvergne-Rhône-Alpes

Disponibilité

Ouvert aux opportunités CDI