Profil

Ingénieur IA & ML diplômé de l'ENSAI, doté d'une expérience pratique en entraînement de LLMs sur clusters de GPU B200, en développement de systèmes multi-agents et en architecture de modèles from scratch. J'allie de solides connaissances en statistiques à un savoir-faire en implémentation et déploiement d'algorithmes sur-mesure.

Expérience Professionnelle

Janv 2025 - Aujourd'hui

AI Engineer

Agence Ministerielle pour l'IA de Défense

Avril - Oct. 2024 Paris

Data Scientist - Stage de fin d'études - 6 mois

Pôle Data et Innovation, Caisse des Dépôts

Prévision des signatures et versements des prêts immobiliers. Etude statistique complète, modélisation de survie avancée, machine learning, reporting auprès d'interlocuteurs diversifiés.

Fév. - Mars 2024 Paris

Data Scientist Consultant - 1 mois et demi

Grande chaîne de sushis (mission junior entreprise)

Analyse de la base de données client (+20 millions de lignes). Segmentation par arbre CART, ACP, K-means. Code optimisé en C++.

Juin - Sept. 2023 Lorient

Data Scientist - Stage de Recherche - 3 mois

IFREMER (Laboratoire Halieutique)

Evaluation de la sélectivité des chaluts en mer Celtique. Modèle bayésien, tests d'hypothèses, intervalles de confiance Bootstrap, état de l'art sur le sujet.

Formation

2024

Ingénieur Data Scientist - ENSAI

Ecole Nationale de la Statistique et de l'Analyse de l'Information

Spécialité génie statistique, promotion 2024

2022

Licence Génie Mathématique

Université de Rennes 1

Double diplôme avec l'ENSAI

2019 - 2021

CPGE MPSI - MP

Lycée Fénelon, Paris

Admis à l'ENSAI sur concours

Projets Académiques

5 mois

API Cadastrale - INSEE

Responsable d'une équipe de 5 étudiants. API Flask interrogeant une base de données cadastrale en ligne, backend de recherches avancées sur le cadastre, gestion de plusieurs utilisateurs.

5 mois

Latent Map Gaussian Processes

Reproduction d'un article scientifique en équipe de 3. Développement d'une librairie d'entrainement de processus gaussiens sur données mixtes (quantitatives et catégorielles).

2 mois

Prévision consommation énergétique

Entrainement et comparaison des performances de modèles SARIMA, XGBoost et RNN.

2 mois

Apprentissage par renforcement - Snake

Développement d'un algorithme apprenant à jouer à Snake sans supervision.

1 mois

NLP - Analyse de sentiments

Web scraping, classification par embeddings, extraction de sujets, visualisation par ACP / UMAP.

5 mois

Prévision du développement cardiaque de nourrissons - CHU Rennes

Ensemble learning, modèles linéaires mixtes, Lasso, XGBoost.