Formation Industrialisation d'un Projet Data en Python

Nouvelle formation

Découvrez comment passer en production un projet data avec cette formation industrialisation de projets data en python

Prochaines sessions (3 jours) :

2 au 4 octobre 2024 à Paris et à distance

Formation Industrialisation d'un Projet Data en Python aussi disponible dans vos locaux (sur demande)

Description

Vous êtes data scientist, data analyst ou développeur, et vous avez l'impression qu'il vous manque des compétences pour passer à l'industrialisation de vos projets data. Vous voulez comprendre les outils de mise en production et maîtriser les bonnes pratiques d'industrialisation.

Trois jours intensifs pour manipuler les outils d'industrialisation de projets data du versioning à la mise en production (CI/CD) en passant par les outils de vérification de code.

Vous découvrirez ou approfondissez à la fois Git, les outils d'intégration continue, les linters et bien d'autres concepts centraux dans la bonne industrialisation de vos projets data en python.

Formation en petits groupes avec maximum 7 participants pour plus d’échanges avec notre formateur !

Inscrivez-vous !

Le programme

Objectifs de la formation industrialisation d'un projet data en python

  • Découvrir les techniques de Software Engineering appliquées à la Data Science
  • Créer une version packagée et testée d'un modèle simple
  • Réaliser les différentes étapes d'une mise en production d'un modèle de Data Science

Organisation des journées

Durant ces journées, nous nous concentrons sur des applications pratiques pour maîtriser les concepts liés à l'industrialisation.

Jour 1

  • Qu'est-ce que l'industrialisation ?
    • Quelles sont les grandes thématiques de l'industrialisation d'un projet ?
    • Pourquoi et pour qui industrialiser ?
  • Le version control, et les outils qui l'entourent (Gitlab, Github)
  • Découverte des principes de clean code
    • Application des différentes règles dans le contexte d'une MR
    • Écriture d'un code en suivant des standards de qualité élevés
    • Application des principes de clean code aux notebooks
  • Découverte des outils de vérification statique
    • Utilisation d'un linter
    • Utilisation du typage statique
Jour 2
  • Les différents types de tests, et leur application au contexte de la data science
    • Écriture d'un test unitaire, intégration et e2e
    • Application des principes du testing à la thématique ML
    • Écriture d'un pipeline CI / CD lançant plusieurs types de test
  • Les outils de documentation et leur principe
    • Documentation automatique du code avec Sphinx
    • La documentation comme substitut à la revue scientifique à partir d'outils collaboratifs tels que Slite
Jour 3
  • Découverte du processus de recette d'un algorithme
  • Mise en production d'un algorithme
    • Rédaction et application d'un processus de recette d'un algorithme
    • Description du principe d'itération
  • Suivi de la qualité et monitoring des performances d'un algorithme
  • Mise en production et dockerisation d'un projet

Les outils

Lors de cette formation, nous utiliserons différents outils liés aux environnements python et au principes de développement : VSCode, Git, Jupyter... Le support sera disponible sous forme de Jupyter Notebooks.

Les participants auront accès à un environnement de développement durant la formation et à la suite de la formation afin de pratiquer sans avoir à installer tous les outils sur leurs machines.

Le formateur

Votre formateur Pierre est entrepreneur dans le domaine de la technologie et directeur technique.

Il a dirigé des équipes techniques avec des profils et compétences très variées, et possède une vision large des problématiques de traitement de données dans de multiples contextes.

En parallèle de ses projets entrepreneuriaux, il dédie une partie de son temps à l'enseignement et aux formations par intérêt pour la transmission et la pédagogie.

  • anaconda
  • Python
  • Jupyter

Profils :

  • Data analyst et data scientist désirant acquérir des compétences en industrialisation
  • Développeur Python souhaitant accompagner la mise en production de modèles

Prérequis :

  • Connaissances de base en traitement de données (statistique et
    tables de données)
  • Connaissances de base du langage Python

Besoin de conseils ou d'informations, contactez-nous au 01.72.25.40.82

Inscription

Tarif inter-entreprises : 1800 euros par participant pour 3 jours

  • Réductions disponibles pour les financements personnels, les étudiants et en cas d'inscriptions multiples
  • Nos tarifs sont HT et n'incluent pas les déjeuners
  • Tarif intra-entreprise (sur mesure, selon vos besoins) : nous contacter pour évaluation

Prochaines sessions :
2 au 4 octobre 2024 à Paris et à distance

Inscription et demande d'informations

Veuillez remplir le formulaire ci-dessous pour vous inscrire, obtenir un devis ou des détails sur la formation proposée.

Toutes nos formations peuvent être prises en charge par l'ensemble des OPCO grâce à notre référencement DataDock et à notre certification Qualiopi.

    ouinon
    ouinon
    ouinon
    En cliquant sur "Envoyer", vous acceptez que vos données personnelles soient utilisées pour vous recontacter dans le cadre de votre demande.
    Pour connaître et exercer vos droits, veuillez consulter notre politique de confidentialité.

    Organiser une session sur mesure !

    Cette formation est disponible en session sur mesure organisée dans votre structure pour un groupe allant jusqu'à 8 participants. Contactez-nous pour organiser une session.

    Vous voulez aller plus loin, suivez notre parcours python pour la data
    D'AUTRES FORMATIONS POUR VOUS

    Partager cette page