Databricks pour utilisateurs : notebooks, Spark, Delta Lake et analyse de données distribuée sur la lakehouse platform.
Sessions en présentiel à Paris ou à distance. Inscriptions ouvertes jusqu'à la veille du démarrage.
La formation Databricks pour utilisateurs vous initie en 3 jours à la plateforme lakehouse leader du marché. Vous comprenez les fondamentaux de Databricks et son positionnement dans l’écosystème Big Data, face aux solutions traditionnelles d’entrepôt et de datalake. Vous explorez l’interface Databricks et manipulez des notebooks collaboratifs en Python, SQL ou Scala. Vous ingérez, transformez et analysez des jeux de données avec PySpark et Spark SQL. Vous maîtrisez l’architecture des clusters Databricks et optimisez les performances de vos traitements. Vous construisez des pipelines de données et orchestrez des workflows avec Databricks Workflows ou Delta Live Tables. Vous appliquez des cas d’usage concrets autour de la business intelligence, de la data science et du machine learning.
Chaque journée alterne apports théoriques courts et ateliers pratiques. Programme ajustable en intra-entreprise.
• Fondamentaux de Databricks et positionnement dans l’écosystème Big Data
• Architecture lakehouse et concepts clés
• Exploration de l’interface et des notebooks collaboratifs
• Premiers traitements en Python et SQL
• Gestion des clusters
• Ingestion, transformation et analyse avec PySpark et Spark SQL
• Delta Lake : fiabilité et performance des données
• Optimisation des performances et architecture des clusters
• Gestion des tables et du catalogue
• Travaux pratiques sur de grands jeux de données
• Construction de pipelines de données
• Orchestration de workflows (Workflows, Delta Live Tables)
• Cas d’usage business intelligence
• Cas d’usage data science et machine learning
• Atelier de synthèse
Les outils que vous manipulerez tout au long de la formation.
Cette formation est éligible aux principaux dispositifs de financement de la formation professionnelle. Notre équipe vous accompagne dans le montage du dossier.
OPCO — Prise en charge par votre opérateur de compétences au titre du plan de développement des compétences de votre entreprise.
Plan de développement — Inscription dans le plan de formation de votre entreprise, en direct avec votre service RH ou formation.
Financement personnel — Tarifs adaptés pour les indépendants et auto-entrepreneurs, paiement en plusieurs fois possible.
La formation dure 3 jours (21 heures) et se déroule en présentiel ou à distance, en groupe limité à 8 participants pour préserver l'interactivité et la pratique.
Pour suivre cette formation dans de bonnes conditions, il est recommandé d'avoir : Connaissances de base en SQL; Notions de Python ou Spark appréciées.
Delta Lake est un format de stockage qui apporte fiabilité et performance aux données dans Databricks. La formation l'utilise pour le traitement de données à grande échelle.
Des connaissances de base en SQL sont nécessaires et des notions de Python ou Spark sont appréciées. La formation accompagne la prise en main de PySpark.
Inscrivez-vous à l'une de nos sessions programmées, ou optez pour une formation intra sur mesure adaptée à votre équipe.
Une question ? Appelez-nous au 01.72.25.40.82
Cette formation Databricks pour utilisateurs vous initie en 2 jours à la plateforme lakehouse leader du marché. Vous découvrez l’environnement Databricks, les notebooks collaboratifs, Spark en Python ou SQL, Delta Lake et les bonnes pratiques d’analyse de données à grande échelle. La formation s’appuie sur des ateliers pratiques sur un workspace Databricks. Idéale pour data analysts, data scientists et data engineers travaillant ou souhaitant travailler sur Databricks.