Formation Data Engineer & Big Data

Formation DevOps pour la Data Science

DevOps pour la data science : conteneurs, CI/CD, infra as code et industrialisation des projets data et ML.

Prochaines sessions

Dates des prochaines sessions

Sessions en présentiel à Paris ou à distance. Inscriptions ouvertes jusqu'à la veille du démarrage.

1 → 2 juillet 2026
à distance et à Paris
S'inscrire à cette session →
10 → 11 décembre 2026
à distance et à Paris
S'inscrire à cette session →
Présentation

La formation DevOps pour la data science vous apprend en 2 jours à appliquer les principes DevOps à vos projets data et machine learning. Vous comprenez les principes fondamentaux du DevOps appliqués aux projets data : automatisation, reproductibilité, collaboration, observabilité. Vous maîtrisez Git et GitHub/GitLab pour le versioning et la collaboration. Vous mettez en place des workflows d’intégration et déploiement continu (CI/CD) pour les scripts analytiques et modèles ML. Vous automatisez le traitement et l’orchestration des pipelines de données avec Apache Airflow. Vous déployez des modèles et analyses dans un environnement cloud (conteneurs Docker, Kubernetes, services managés). Vous appliquez les bonnes pratiques de surveillance et de monitoring des analyses et modèles en production. Idéale pour data scientists et data engineers visant la production.

Objectifs pédagogiques

  • Comprendre les principes fondamentaux du DevOps appliqués aux projets data
  • Maîtriser Git et GitHub/GitLab pour le versioning et la collaboration
  • Mettre en place des workflows d'intégration et déploiement continu (CI/CD) pour les scripts analytiques et modèles ML
  • Automatiser le traitement et l'orchestration des pipelines de données avec Apache Airflow
  • Déployer des modèles et analyses dans un environnement cloud
  • Appliquer les bonnes pratiques de surveillance et de monitoring des analyses et modèles en production
Programme détaillé

2 jours, 14 heures de pratique

Chaque journée alterne apports théoriques courts et ateliers pratiques. Programme ajustable en intra-entreprise.

1 Principes du DevOps, automatisation et CI/CD

• Introduction au DevOps appliqué à la data science
• Différences entre DevOps classique et MLOps / DataOps
• Git et GitHub/GitLab pour le versioning et la collaboration
• Conteneurisation avec Docker
• Mise en place de workflows d’intégration et déploiement continu (CI/CD)
• CI/CD pour les scripts analytiques et les modèles ML

2 Orchestration, déploiement cloud et monitoring

• Orchestration des pipelines avec Apache Airflow
• Gestion des environnements et des dépendances
• Déploiement de modèles et d’analyses dans le cloud
• Bonnes pratiques de mise en production
• Surveillance et monitoring des modèles en production
• Atelier : pipeline complet de bout en bout

Télécharger le programme détaillé en PDF

Public concerné

Profils et prérequis

Profils concernés

  • Data scientist visant la mise en production
  • Data engineer industrialisant des pipelines
  • Ingénieur ML et ML engineer

Prérequis

  • Bonne maîtrise de Python
  • Bases de Git et de la ligne de commande Linux
  • Notions de cloud appréciées
Les outils

Les logiciels et technologies

Les outils que vous manipulerez tout au long de la formation.

Git GitHub GitLab Docker Apache Airflow CI/CD cloud
Évaluation

Outils d'évaluation des compétences

  • Quiz et QCM à la fin de chaque module pour valider l’acquisition des connaissances théoriques.
  • Mini-projets guidés Auto-évaluation sur la compréhension et la mise en application des concepts.
  • Feedback individuel : chaque participant se voit proposer un bilan de ses points forts et axes d’amélioration.
Financement

Une formation finançable

Cette formation est éligible aux principaux dispositifs de financement de la formation professionnelle. Notre équipe vous accompagne dans le montage du dossier.

OPCO — Prise en charge par votre opérateur de compétences au titre du plan de développement des compétences de votre entreprise.

Plan de développement — Inscription dans le plan de formation de votre entreprise, en direct avec votre service RH ou formation.

Financement personnel — Tarifs adaptés pour les indépendants et auto-entrepreneurs, paiement en plusieurs fois possible.

Voir toutes les solutions de financement

Questions fréquentes

FAQ

Quelle est la durée de la formation et sous quels formats est-elle proposée ?

La formation dure 2 jours (14 heures) et se déroule en présentiel ou à distance, en groupe limité à 8 participants pour préserver l'interactivité et la pratique.

Quels sont les prérequis pour suivre cette formation ?

Pour suivre cette formation dans de bonnes conditions, il est recommandé d'avoir : Bonne maîtrise de Python; Bases de Git et de la ligne de commande Linux; Notions de cloud appréciées.

Quelle est la différence entre DevOps, MLOps et DataOps ?

La formation clarifie ces notions : le DevOps classique vise le logiciel, le MLOps applique ces principes aux modèles de machine learning, et le DataOps aux pipelines de données.

Quels outils d'orchestration sont utilisés ?

La formation utilise Apache Airflow pour l'orchestration des pipelines, ainsi que Docker, Git et des outils de CI/CD pour l'industrialisation.

Prêt à monter en compétences ?

Inscrivez-vous à l'une de nos sessions programmées, ou optez pour une formation intra sur mesure adaptée à votre équipe.

Une question ? Appelez-nous au 01.72.25.40.82

Cette formation DevOps pour la data science vous apprend en 3 jours à appliquer les principes DevOps à vos projets data et machine learning. Au programme : conteneurs Docker, orchestration, CI/CD, infrastructure as code, monitoring et bonnes pratiques MLOps. La formation s’appuie sur des ateliers progressifs pour industrialiser un pipeline de bout en bout. Idéale pour data scientists, data engineers et ingénieurs souhaitant livrer en production de façon fiable et reproductible.

Pour aller plus loin

Formations liées

Ressources & documentation

Le monde de la data tous les mois

En cliquant sur "je m'abonne", vous acceptez de recevoir notre newsletter. Vous avez pris connaissance de notre politique de confidentialité.