Faites du data mining et du machine learning avec R : arbres, random forest, clustering et évaluation de modèles.
Les dates ne sont pas encore fixées. Demandez à être informé(e) en priorité de l'ouverture des inscriptions, ou optez pour une session sur mesure.
La formation data mining et machine learning avec R vous apprend en 2 jours à construire des modèles prédictifs robustes. Vous maîtrisez l’utilisation des packages R dédiés au machine learning, notamment caret et tidymodels, qui standardisent la construction et la comparaison de modèles. Vous comprenez le processus complet de traitement en machine learning : préparation des données, séparation entraînement/test, choix d’algorithme, entraînement, validation, mise en production. La formation couvre les principaux algorithmes (arbres, random forest, boosting, régression logistique, clustering) et vous apprend à interpréter les sorties d’un modèle. Une formation idéale pour analystes, statisticiens et data scientists travaillant en environnement R.
Chaque journée alterne apports théoriques courts et ateliers pratiques. Programme ajustable en intra-entreprise.
• Le processus de traitement en machine learning
• Les packages R pour le machine learning : caret et tidymodels
• Préparation des données et feature engineering
• Séparation entraînement / test et validation croisée
• Premiers modèles : régression et classification
• Arbres de décision, random forest et boosting
• Modèles non supervisés : clustering et réduction de dimension
• Métriques d’évaluation et courbes ROC
• Interprétation des sorties d’un algorithme
• Atelier : projet de data mining de bout en bout
Les outils que vous manipulerez tout au long de la formation.
Cette formation est éligible aux principaux dispositifs de financement de la formation professionnelle. Notre équipe vous accompagne dans le montage du dossier.
OPCO — Prise en charge par votre opérateur de compétences au titre du plan de développement des compétences de votre entreprise.
Plan de développement — Inscription dans le plan de formation de votre entreprise, en direct avec votre service RH ou formation.
Financement personnel — Tarifs adaptés pour les indépendants et auto-entrepreneurs, paiement en plusieurs fois possible.
La formation dure 2 jours (14 heures) et se déroule en présentiel ou à distance, en groupe limité à 6 participants pour préserver l'interactivité et la pratique.
Pour suivre cette formation dans de bonnes conditions, il est recommandé d'avoir : Bases de R (manipulation de données, fonctions); Notions de statistique descriptive.
La formation s'appuie sur caret et tidymodels, qui standardisent la construction et la comparaison de modèles, ainsi que sur les principaux packages d'algorithmes (random forest, boosting).
Des bases de R (manipulation de données, fonctions) sont nécessaires. Si vous débutez, suivez d'abord la formation logiciel R pour la data science.
Inscrivez-vous à l'une de nos sessions programmées, ou optez pour une formation intra sur mesure adaptée à votre équipe.
Une question ? Appelez-nous au 01.72.25.40.82
Cette formation data mining et machine learning avec R vous apprend en 3 jours à construire des modèles prédictifs robustes. Au programme : arbres de décision, random forest, boosting, régression logistique, clustering, et bonnes pratiques d’évaluation (validation croisée, courbes ROC). Vous travaillez sur des cas concrets avec les packages caret, tidymodels et les principaux outils du machine learning R. Une formation parfaite pour analystes et data scientists travaillant en environnement R.