Formation les fondamentaux du big data et de la data science

Prochaines sessions (2 jours) :

Contactez-nous pour obtenir les dates des prochaines sessions

Formation aussi disponible dans vos locaux (sur demande)

A propos

Cette formation comprendre les fondamentaux du big data et de la data science est basée sur des cas pratiques afin de vous familiariser avec les concepts du big data et de la data science.

Vous apprendrez par des exemples à comprendre l’environnement du big data (Hadoop, Spark, Kafka…) et ses applications (open data, internet des objets…).
Cette formation big data vise un public d’analystes, de chargés d’études voulant comprendre les enjeux liés au big data et ne demande aucun prérequis techniques.

Inscrivez-vous !

Le programme

Objectifs

  • Comprendre les principes du big data
  • Maîtriser le vocabulaire lié au big data et à la data science
  • Maîtriser les enjeux pour mettre en œuvre une stratégie big data dans votre entreprise
  • Connaitre les outils et leurs usages

Organisation de la journée

Le big data :

  • Le big data - définitions et usages
  • Quelques business cases de projets big data
  • Qui pour s’occuper des données dans votre structure : le data scientist, le data analyst, le data engineer, le big data architect…

Les données et leur gestion :

  • Les données non structurées
  • Le passage au big data : quels changements pour votre organisation ?
  • Le data lake et les formats de stockage (HDFS, in memory…), quelle solution choisir ?
  • Les outils pour le stockage et la manipulation des données :
    • Le cloud ou on premise ?
    • Les bases de données NoSQL
      • MongoDB
      • Cassandra
      • Redis
      • Les bases de données basées sur des graphes : neo4j
    • Hadoop et son environnement
      • Hive, Pig, MapReduce
      • Ranger pour la sécurité
    • Kafka pour le traitement des flux de données
    • Spark pour le traitement de données et le data analytics
    • Les autres solutions pour les données sur le cloud :
      • Snowflake
      • Redshift
      • ...

La data analytics (predictive analytics) et le machine learning pour l’intelligence artificielle :

  • Différence entre le traitement des données classiques et la data analytics pour le big data
  • Le machine learning : panorama des méthodes et des utilisations (supervisé, non supervisé, renforcement, deep learning)
  • Présentation d’outils pour la data analytics de leurs forces et de leurs faiblesses :
    • Python et R, les outils open source de la data science
    • Apache Spark, la boîte à outils pour le big data
    • Les plateformes (forces et faiblesses) :
      • Dataiku DSS
      • Databricks
      • Alteryx
      • KNIME
      • Anaconda

Les étapes d'un projet big data :

  • La gouvernance des données
  • Le déroulé d'un projet suivant différents cas d'usage
  • L'évaluation de la réussite d'un projet data

Les objectifs d'une stratégie big data :

  • Comment définir une stratégie big data dans votre entreprise.
  • Présentation de cas réels d'applications big data
  • Comment éviter les pièges liés à un projet big data
  • Exemples de déroulés de projets dans différents domaines
    • Gestion client
    • Détection de fraude
    • Manufacturing

Les outils

Lors de cette formation des outils de m'écosystème big data seront utilisés notamment des outils cloud.

Big Data

Public : Analystes, Chargés d’études, Data scientist désirant avoir un état des lieux du domaine.

Tout public intéressé par la compréhension des fondamentaux du big data et de la data science

Prérequis :

  • Avoir quelques connaissances en traitement de données

Besoin de conseils ou d'informations, contactez-nous au 01.72.25.40.82

Inscription

Tarif inter-entreprises : 1000 euros par participant pour 2 jours

  • Réductions disponibles pour les financements personnels, les étudiants et en cas d'inscriptions multiples
  • Nos tarifs sont HT et n'incluent pas les déjeuners
  • Tarif intra-entreprise (sur mesure, selon vos besoins) : nous contacter pour évaluation

Demande de devis et d'informations

Veuillez remplir le formulaire ci-dessous pour vous inscrire, obtenir un devis ou des détails sur la formation proposée.

Toutes nos formations peuvent être prises en charge par l'ensemble des OPCO grâce à notre référencement DataDock et à notre certification Qualiopi.

    ouinon
    ouinon
    ouinon
    En cliquant sur "Envoyer", vous acceptez que vos données personnelles soient utilisées pour vous recontacter dans le cadre de votre demande.
    Pour connaître et exercer vos droits, veuillez consulter notre politique de confidentialité.

    Organiser une session sur mesure !

    Cette formation est disponible en session sur mesure organisée dans votre structure pour un groupe allant jusqu'à 8 participants. Contactez-nous pour organiser une session.

    D'autres formations pour vous

    Partager cette page