Bonjour,
je suis Abdelmajid EL HOU

Je suis

Voir mon parcours

À propos de moi

Portrait d'Abdelmajid EL HOU

Je suis Abdelmajid

Tech Lead Data / Data Engineer & Formateur

Scientifique de formation (PhD en bio-informatique, Master et Licence en biologie), j’accompagne et pilote des équipes data sur des projets à l’intersection de la science, de la data et de l’IA appliquée.

En tant que Lead Tech Data, j’assure la conception, la migration et la fiabilisation de pipelines complexes tout en diffusant les bonnes pratiques techniques et en guidant les équipes sur les aspects méthodologiques et technologiques.

J’ai mené des projets dans des environnements variés — santé, assurance, banque et secteur public — autour du data engineering, du traitement de données massives et de l’automatisation en Python, R ou Scala.

En parallèle, je conçois et j’anime des formations (Python, R, Linux, statistiques) et propose du mentorat pour étudiants, doctorants et professionnels en reconversion.

based : Paris, France

langues : Français, Anglais, Arabe

Compétences & outils

Python Python
Spark Spark
Scala Scala
SQL SQL
Langage R Langage R
Linux et Bash Linux & Bash
Git et GitLab Git / GitLab
Jenkins Jenkins
Hadoop Hadoop
KNIME KNIME
Excel avancé Excel avancé
AWS et Cloud AWS & Cloud

Mon parcours académique

Toujours relier la science des données aux usages métiers concrets.

Promo ENSAE x OpenClassrooms

Diplôme Data Analyste

ENSAE x OpenClassrooms — Paris

2021 - 2022 | Spécialisation Data Analyse, SQL, Python & ML

Université de Limoges

Doctorat en Génomique & Bioinformatique

Université de Limoges — Laboratoire PEIRENE/INRAE

2017 - 2021 | Identification de gènes impliqués dans la qualité de la viande bovine

AgroParisTech

Master Predictive & Integrative Animal Biology

AgroParisTech — Université Paris-Saclay

2015 - 2017 | Génétique quantitative & Statistiques avancées

Université d'Évry

Licence Biologie Moléculaire & Cellulaire

Université d'Évry

2014 - 2015 | Sciences de la vie

Mes services

Formations sur mesure, mentorat individuel et accompagnement technique. L’intégration du module de paiement sécurisé et du calendrier de réservation est en cours ; utilisez les boutons ci-dessous pour bloquer un créneau pour le moment.

Mentorat Data Python / R

Coaching individuel pour maîtriser Python, R, Pandas, tidyverse et structurer des pipelines fiables.

  • Programme personnalisé + revue de notebooks
  • Préparation projets ENSAE / OpenClassrooms
  • Simulation d’entretiens techniques
Mentorat 4 à 12 séances Réserver un créneau

Statistiques & RStudio

Sessions pratiques sur les stats appliquées, RStudio, RMarkdown et Shiny pour produire des analyses solides.

  • Stats descriptives, inférentielles, causalité
  • Data storytelling pour publications/comités
  • Support doctorants & reconversions
Atelier ou coaching Planifier une session

Formations Linux (Entreprise)

Programmes sur mesure pour les équipes data/IT : Linux, Bash, sécurité, VTOM/Jenkins et industrialisation.

  • Prise en main serveurs & scripting Bash
  • Outillage DevOps (GitLab, Jenkins, VTOM)
  • Modules conformité & RGPD
Bootcamp intra Organiser une formation

Formations SQL & Bases

Ateliers SQL avancés (PostgreSQL, Teradata, Hive) et modélisation relationnelle pour équipes métiers/IT.

  • Requêtes avancées, optimisation & tuning
  • Conception UML / MCD / MERISE
  • Cas pratiques data warehouse
Format équipe ou individuel Construire le programme

Aide à la réalisation de projets data

Co-pilotage de vos projets (collecte, pipelines, IA, data viz) pour étudiants, doctorants et entreprises.

  • Cadrage et feuille de route technique
  • Pair-programming & revue de code
  • Livrables prêts pour soutenance ou production
Coaching projet Discuter de votre projet

Coaching emploi IT

Stratégie de carrière, audit CV/LinkedIn et préparation aux entretiens pour viser les postes data/IT ciblés.

  • Storytelling de parcours & personal branding
  • Préparation technique & RH
  • Conseils freelancing / CDI / mission
Coaching carrière Planifier un échange

Paiement en ligne & calendrier de réservation seront activés très bientôt. D’ici là, précisez vos disponibilités via le mail ou via Whatsapp(Infos en bas de la page).

Mes certificats

Un aperçu des principales certifications obtenues durant mes parcours ENSAE/OpenClassrooms, missions de consulting et formations continues.

Certification introduction Python

Python - OpenClassrooms

Initiation au langage & bonnes pratiques
Certification librairies pandas

Librairies Pandas

Manipulation & reporting
Certification nettoyage de données

Nettoyage de données

Qualité, contrôle & automatisation
Certification rapports statistiques

Rapports statistiques

Production d'insights & storytelling
Certification probabilités

Probabilités & Stats

Approche ENSAE - modélisation
Certification statistiques inférentielles

Statistiques inférentielles

Tests, intervalles, causalité
Certification introduction IA

Introduction IA

Panorama IA & cas d'usage
Certification machine learning

Machine Learning

Modèles supervisés & non supervisés
Certification Tableau

Tableau

DataViz & dashboards
Certification Excel avancé

Excel avancé

Automatisation & modèles financiers
Certification SQL / algèbre relationnelle

SQL & Algèbre relationnelle

Modélisation & optimisation
Certification UML

UML & Modélisation

Architecture de données
Certification apprendre à apprendre

Apprendre à apprendre

Techniques pédagogiques
Certification veille stratégique

Veille & soft skills

Organisation & communication
Certification soft skills

Soft skills Data

Coaching équipes & clients
Certification PySpark

PySpark & Big Data

Projet Groupama G2S
×

Expérience

iMSA

Lead Tech Data

2024 - aujourd'hui · Espagne / France

  • Pilotage de la migration de traitements SAS vers RStudio Server (assurance, santé, retraite) en environnement open source.
  • Structuration complète de l'écosystème R : conventions, arborescences, templates de livrables, logs et jeux de tests.
  • Gouvernance GitLab : branches, scripts de production, tagging/changelog et automatisation CI/CD.
  • Mentoring, revues de code, animation de points techniques et coordination métiers / DSI.
  • Suivi des performances RStudio Server (CPU, RAM, stockage, parallélisation) et pilotage Ops.

Compétences : R (tidyverse, data.table, vroom, openxlsx), GitLab CI/CD, Linux, shell scripts, monitoring serveur.

MAIF

Consultant Data - Squad Analytics

Juin 2024 - Juin 2025 · Niort

  • Rédaction des spécifications fonctionnelles pour intégrer de nouvelles sources décisionnelles.
  • Ingestion, transformation et purge multi-technos (SQL, Python) avant stockage.
  • Extraction de données via requêtes SQL/Python et automatisation des scripts de nettoyage.
  • Migration des traitements Hadoop (Hive) et Netezza vers Greenplum avec stockage S3.
  • Documentation sur Confluence et pilotage des user stories via Jira.

Outils : Python, Bash Linux, SQL, Hadoop/Hive, DBeaver, Greenplum/PostgreSQL, Oracle, VTOM, Confluence, Jira.

Groupama G2S

Data Engineer - Spark/Scala

Avril 2023 - Février 2024 · Puteaux

  • Ingestion et exposition de données multi-formats (CSV, Avro, Hive) au sein du data lake.
  • Mise en place et monitoring des workflows Oozie (alerting, reprises, SLA).
  • Industrialisation et packaging des pipelines Spark/Scala.
  • Automatisation Bash sur Hive et scripting d'exploitation.
  • Suivi des jalons Dev → Prod et documentation Cloudera / Confluence.

Outils : Spark, Scala, Bash, Python, HDFS, Hive, Oozie, Yarn, Opcon, GitLab, Confluence, Jira.

Groupe BPCE-SI

Consultant Scientist

Juin 2022 - Février 2023 · Paris

  • Traitement de données Teradata, fichiers plats et Excel avec Python & SQL.
  • Préparation statistique (Python, Bash) et industrialisation des applications Python.
  • Développement et débogage d'algorithmes d'anomalies (Isolation Forest, k-modes) déployés sur 13 banques.
  • Mise en production des applications et restitution des KPI dans Power BI.

Outils : Python (Pandas, NumPy, Scikit-Learn), Bash, SQL, Teradata, Power BI, Jenkins, SonarQube, VTOM, Git.

Fiverr

Data Analyst / Scientist | Trainer

Jan. 2020 - Mai 2022 · Paris · Remote

  • Mentorat de profils master/doctorat sur des projets data science, bioinformatique et visualisation.
  • Analyses appliquées : satisfaction compagnies aériennes, immobilier, malnutrition, COVID et e-commerce.
  • Conception/industrialisation de bases SQL (MySQL, PostgreSQL) et automatisations Python/R/Bash.
  • Déploiement de dashboards (Google Data Studio, Tableau, Sheets) et outils de suivi pour clients.
  • Accompagnement sur ML non supervisé (Kmeans, CAH, ACP) et scripts Bash pour pipelines génomiques.

Environnement : Excel, Python, R, Knime, SQL, Bash/Linux, Tableau, Google Data Studio, Jupyter, RStudio, WordPress.

Université de Limoges

Data Analyst & Bioinformaticien - Formateur

Oct. 2017 - Déc. 2021 · Limoges · Sur site

  • Analyse de données omics (génotypes, RNA-Seq) volumineuses issues de trois races bovines.
  • Statistiques multivariées et bayésiennes (R, Bash) sur clusters Genotoul pour valider les modèles.
  • Rédaction d’articles internationaux, animation de séminaires nationaux et restitution des résultats.
  • Enseignement licences professionnelles (biochimie, génétique, data) et organisation du séminaire génétique animale.
  • Contribution aux actions PSC1 et coordination avec les équipes pédagogiques.
Planifier un échange

Réalisations & services

Sélection de missions récentes mêlant data engineering, IA appliquée et accompagnement pédagogique.

Discuter d'un projet

Entrer en contact

Pour une mission, une intervention ou du mentorat, laissez-moi un message ou contactez-moi directement :