Formation python

Formation scikit-learn pour le machine learning

Maîtrisez scikit-learn pour le machine learning : pipelines, modèles supervisés et non supervisés, évaluation et tuning.

4,8 / 5 — note moyenne des participants

S'inscrire à une session ↓ Voir le programme

Prochaines sessions

Dates des prochaines sessions

Sessions en présentiel à Paris ou à distance. Inscriptions ouvertes jusqu'à la veille du démarrage.

5 → 6 novembre 2026

à distance et à Paris

S'inscrire à cette session →

Demande d'informations Session sur mesure / intra

Présentation

La formation scikit-learn vous donne en 2 jours les clés pour construire des modèles de machine learning robustes en Python. Vous découvrez les principaux concepts du machine learning : apprentissage supervisé, non supervisé, séparation entraînement/test, validation croisée, métriques d’évaluation. Vous apprenez à construire un pipeline complet avec scikit-learn, en intégrant prétraitement, sélection de variables, entraînement et évaluation. La formation vous fait maîtriser toutes les étapes de création d’un modèle, de la préparation des données à la validation des performances. Très orientée pratique, elle s’appuie sur des jeux de données réels et des cas métier variés (classification, régression, clustering). Indispensable pour tout data scientist en formation.

Objectifs pédagogiques

Connaître les principaux concepts du machine learning
Construire un pipeline de machine learning avec scikit-learn
Maîtriser les étapes de création d'un modèle, de la préparation à la validation

Programme détaillé

2 jours, 14 heures de pratique

Chaque journée alterne apports théoriques courts et ateliers pratiques. Programme ajustable en intra-entreprise.

1 Fondamentaux et premiers modèles avec scikit-learn

• Les concepts du machine learning et le processus de construction d’un modèle
• L’écosystème scikit-learn (Python, NumPy, pandas)
• Les principes de scikit-learn et la notion de pipeline
• Un premier modèle de machine learning avec scikit-learn
• Préparation des données et preprocessing : données qualitatives, manquantes, ColumnTransformer

2 Sélection, évaluation et méthodes avancées

• Gestion du sur-apprentissage et validation (train/test, validation croisée)
• Les métriques d’évaluation des modèles
• Ajustement des hyperparamètres et combinaison dans un pipeline
• Focus sur les méthodes : modèles linéaires, modèles à base d’arbres (forêts aléatoires, GBM)
• Modèles non supervisés avec scikit-learn
• Passage en production d’un modèle : les différentes approches

Télécharger le programme détaillé en PDF ↓

Public concerné

Profils et prérequis

Profils concernés

Data scientist en formation sur le machine learning
Data analyst souhaitant aborder la modélisation prédictive
Développeur Python intégrant des modèles ML à ses projets

Prérequis

Bonne maîtrise de Python et de pandas
Notions de base en statistique

Les outils

Les logiciels et technologies

Les outils que vous manipulerez tout au long de la formation.

Python scikit-learn pandas NumPy Jupyter Anaconda

Évaluation

Outils d'évaluation des compétences

Quiz et QCM à la fin de chaque module pour valider l’acquisition des connaissances théoriques.
Mini-projets guidés (manipulation de DataFrames, visualisation) Auto-évaluation sur la compréhension et la mise en application des concepts.
Feedback individuel : chaque participant se voit proposer un bilan de ses points forts et axes d’amélioration.

Financement

Une formation finançable

Cette formation est éligible aux principaux dispositifs de financement de la formation professionnelle. Notre équipe vous accompagne dans le montage du dossier.

OPCO — Prise en charge par votre opérateur de compétences au titre du plan de développement des compétences de votre entreprise.

Plan de développement — Inscription dans le plan de formation de votre entreprise, en direct avec votre service RH ou formation.

Financement personnel — Tarifs adaptés pour les indépendants et auto-entrepreneurs, paiement en plusieurs fois possible.

Voir toutes les solutions de financement →

Questions fréquentes

FAQ

Quelle est la durée de la formation et sous quels formats est-elle proposée ?

La formation dure 2 jours (14 heures) et se déroule en présentiel ou à distance, en groupe limité à 7 participants pour préserver l'interactivité et la pratique.

Quels sont les prérequis pour suivre cette formation ?

Pour suivre cette formation dans de bonnes conditions, il est recommandé d'avoir : Bonne maîtrise de Python et de pandas; Notions de base en statistique.

Quels types d'algorithmes sont couverts ?

La formation couvre la régression, la classification, les modèles linéaires, les modèles à base d'arbres (forêts aléatoires, GBM) et les modèles non supervisés, avec une approche par pipelines scikit-learn.

Faut-il des bases en statistiques ?

Des notions de base en statistique sont recommandées, ainsi qu'une bonne maîtrise de Python et de pandas, mais la formation revient sur les concepts clés du machine learning.

Prêt à monter en compétences ?

Inscrivez-vous à l'une de nos sessions programmées, ou optez pour une formation intra sur mesure adaptée à votre équipe.

S'inscrire à une session ↓ Organiser une session intra

Une question ? Appelez-nous au 01.72.25.40.82

Cette formation scikit-learn vous donne en 3 jours les clés pour construire des modèles de machine learning robustes en Python. Vous abordez les principales familles d’algorithmes (régression, classification, clustering), la construction de pipelines, la validation croisée, le réglage d’hyperparamètres et l’interprétation des modèles. La formation, très orientée pratique, repose sur des jeux de données réels et des cas métier variés. Indispensable pour tout data scientist en formation.

Pour aller plus loin

Formations liées

Ressources & documentation

Documentation officielle scikit-learn lien externe ↗ Guide utilisateur scikit-learn lien externe ↗

Formation scikit-learn pour le machine learning

Dates des prochaines sessions

Objectifs pédagogiques

2 jours, 14 heures de pratique

Profils et prérequis

Profils concernés

Prérequis

Les logiciels et technologies

Outils d'évaluation des compétences

Une formation finançable

FAQ

Prêt à monter en compétences ?

Formations liées

Formation python et Excel – Python pour les utilisateurs d’Excel

Formation python pour la data science

Formation manipuler de grandes données avec Polars, DuckDB et Arrow

Formation pandas avancé (method chaining et stylisation)

Formation data visualisation avec Python

Formation Industrialisation d’un Projet Data en Python

Formation python pour l’analyse de données

Formation python pour utilisateur de SAS

Formation Spark avec Python – utilisation de pyspark

Formation analyse textuelle avec python

Ressources & documentation