Formation python pour la data science
Prochaines sessions (3 jours) :
25 au 27 janvier 2021 en salle de classe virtuelle
8 au 10 mars 2021
31 mai au 2 juin 2021
Formation aussi disponible dans vos locaux (sur demande)
A propos
Que vous soyez data scientist, utilisateur de R, analyste SAS ou développeur, et que vous désirez découvrir python pour la data science et le traitement des données, cette formation est faite pour vous.
Trois jours intensifs pour acquérir les bases de l’utilisation du langage python pour des applications en analyse de données, data mining et data science.
Après une introduction au langage python (ou un rappel si vous avez déjà utilisé python), vous apprendrez à maîtriser les bibliothèques spécialisées en data science, data mining et data visualisation. Basée sur de nombreux exercices pratiques, cette formation vous permet d’être immédiatement opérationnel pour le traitement de vos données grâce à python.
Formation en petits groupes avec maximum 6 participants pour plus d’échanges avec nos formateurs !
Le programme
Objectifs
- Maîtriser les bases de python
- Etre capable d’analyser des données avec python
- Etre capable d’automatiser le traitement de données avec python
- Connaître les outils pour la data science de python
Organisation des journées
Durant ces journées, nous nous concentrons sur des applications pratiques pour maîtriser le langage python.
Jour 1
- Introduction au langage python
- Pour qui ? Pour quoi faire ? Comment ?
- Les consoles et le débogage en python
- Le langage (la syntaxe, les structures (string, listes, dictionnaires…), les opérateurs et les fonctions)
- Construction d’un outil de calcul de statistiques simples
- Les classes, les objets et la création de bibliothèques
- Python pour le traitement des données
- Le processus de développement d’un outil en python pour la data science
- L’importation des données (texte, csv, Excel, web scrapping., SQL..)
Jour 2 :
- La préparation et le nettoyage des données (jointure, filtre, transformation, traitement des données manquantes avec pandas, numpy et scipy)
- La data visualisation
- Présentation des principes de la data visualisation
- Quelques graphiques simples avec matplotlib : scatter plot, box plot, histogrammes…
- Présentation de visualisation plus avancées
- Utilisation de Bokeh pour des visualisations interactives
- Introduction au machine learning : présentation des principes de l’apprentissage automatique
Jour 3:
- Préparation des données avec la bibliothèque scikit-learn
- Cas pratiques en machine learning
- La prévision en marketing
- L’extraction d’informations pertinentes
- Les k-means pour la compression d’images
- Les k-plus proches voisins pour la prévision de scores
- Le traitement de données textuelles
- La classification d’image avec le deep learning
- L’automatisation et la mise en production de traitements avec python (pipeline)
- Les bibliothèques pour le big data et le deep learning
- pyspark
- keras
- Discussions et démonstrations de fonctionnalités avancées sur les problématiques des participants
Les outils
Lors de cette formation, nous utiliserons Anaconda et Jupyter pour illustrer l'utilisation de Python en analyse de données.
Profils :
- Data analyst désirant découvrir python en
data science - Manager désirant comprendre les
spécificité de python - Développeur spécialisé dans d’autres
langages
Prérequis :
- Connaissances de base en traitement de données (statistique et
tables de données) - Pas de prérequis en python
Besoin de conseils ou d'informations, contactez-nous au 01.72.25.40.82
Inscription
Tarif : 1500 euros par participant pour 3 jours
- Réductions disponibles pour les financements personnels, les étudiants et en cas d'inscriptions multiples
- Nos tarifs sont HT et n'incluent pas les déjeuners.
Inscription et demande d'informations
Veuillez remplir le formulaire ci-dessous pour vous inscrire, obtenir un devis ou des détails sur la formation proposée.
Toutes nos formations peuvent être prises en charge par l'ensemble des OPCA grâce à notre référencement DataDock.
Evaluations
Témoignages
Très clair, très complet, donnant les moyens de passer de débutant à pleinement opérationnel en un temps record. Excellente mise en contexte pour permettre de comprendre la raison et la logique de chaque élément.Christophe W. sur la formation Python pour la data science
Lieu et horaires
Salle de formation à Paris
de 9h30 à 17h30
Cette formation est disponible en session sur mesure organisée dans votre structure pour un groupe allant jusqu'à 8 participants. Contactez-nous pour organiser une session.
Partager cette page