Formez-vous au langage R pour la data science : manipulation tidyverse, visualisation ggplot2 et statistiques appliquées.
Sessions en présentiel à Paris ou à distance. Inscriptions ouvertes jusqu'à la veille du démarrage.
La formation logiciel R pour la data science vous donne en 3 jours les bases solides pour exploiter le langage R dans vos analyses. Vous maîtrisez l’environnement de travail R avec RStudio, puis manipulez et gérez vos données avec les packages les plus récents : dplyr, tidyr, data.table. Vous découvrez l’application de méthodes de data science : statistiques descriptives, tests, modélisation, visualisation avec ggplot2. La formation aborde également les bases de la programmation avec R (fonctions, structures de contrôle, packages personnalisés). La pédagogie repose sur des cas pratiques issus du quotidien des analystes et data scientists. Une formation R idéale pour toute personne souhaitant adopter un outil open source puissant pour l’analyse statistique.
Chaque journée alterne apports théoriques courts et ateliers pratiques. Programme ajustable en intra-entreprise.
• L’environnement de travail R avec RStudio
• Syntaxe de base : objets, vecteurs, fonctions, structures de contrôle
• Types de données et structures (vecteurs, listes, data frames)
• Import et export de données (CSV, Excel, bases de données)
• Premiers traitements et bonnes pratiques
• Manipulation de données avec le tidyverse : dplyr et tidyr
• Traitement performant avec data.table
• Nettoyage, transformation et recodage des variables
• Jointures, agrégations et données manquantes
• Travail sur les dates et les chaînes de caractères
• Statistiques descriptives et premières analyses
• Visualisation des données avec ggplot2
• Application de méthodes de data science
• Bases de la programmation R : fonctions, itérations, packages
• Atelier de synthèse sur un jeu de données réel
Les outils que vous manipulerez tout au long de la formation.
Cette formation est éligible aux principaux dispositifs de financement de la formation professionnelle. Notre équipe vous accompagne dans le montage du dossier.
OPCO — Prise en charge par votre opérateur de compétences au titre du plan de développement des compétences de votre entreprise.
Plan de développement — Inscription dans le plan de formation de votre entreprise, en direct avec votre service RH ou formation.
Financement personnel — Tarifs adaptés pour les indépendants et auto-entrepreneurs, paiement en plusieurs fois possible.
La qualité de la formatrice - Qualité des échanges - Exemples pratiques
A. K.Les compétences du formateur. Son adaptation.
G. D.Permet de démarrer rapidement en terme de manipulation, et d'approfondir aussi compte tenu de la richesse du "package"
P. A.La formation dure 3 jours (21 heures) et se déroule en présentiel ou à distance, en groupe limité à 6 participants pour préserver l'interactivité et la pratique.
Aucun prérequis technique n'est nécessaire pour suivre cette formation. Bases de la statistique descriptive.
Oui, la manipulation de données s'appuie sur le tidyverse (dplyr, tidyr) et sur data.table, et la visualisation sur ggplot2, soit les standards actuels de l'écosystème R.
Oui, la manipulation de données s'appuie sur le tidyverse (dplyr, tidyr) et sur data.table, et la visualisation sur ggplot2, soit les standards actuels de l'écosystème R.
Inscrivez-vous à l'une de nos sessions programmées, ou optez pour une formation intra sur mesure adaptée à votre équipe.
Une question ? Appelez-nous au 01.72.25.40.82
Cette formation R pour la data science vous donne en 4 jours les bases solides pour exploiter le langage R dans vos analyses. Vous découvrez la manipulation de données avec le tidyverse (dplyr, tidyr), la visualisation avec ggplot2, et les principaux outils statistiques. La pédagogie repose sur des cas pratiques issus du quotidien des analystes et data scientists. Une formation R idéale pour toute personne souhaitant adopter un outil open source puissant pour l’analyse statistique.