Data Lake : panorama des architectures, choix technologiques et briques essentielles pour exploiter un lac de données.
Sessions en présentiel à Paris ou à distance. Inscriptions ouvertes jusqu'à la veille du démarrage.
La formation Data Lake vous donne en 2 jours une vision complète des architectures et choix technologiques pour exploiter un lac de données. Vous réalisez un panorama des différents outils et thématiques de data engineering : ETL et ELT, datalake et datawarehouse, bases SQL et NoSQL, moteurs SQL distribués, catalogues de données. Vous faites une revue des différentes méthodologies de choix d’une technologie selon le contexte : volumétrie, latence, coût, compétences disponibles, écosystème existant. Vous savez proposer et décrire une architecture répondant à un cas d’usage : ingestion, stockage, transformation, consommation, gouvernance. La formation s’appuie sur des cas réels d’entreprise. Idéale pour architectes data, chefs de projet et data engineers cadrant leur plateforme data.
Chaque journée alterne apports théoriques courts et ateliers pratiques. Programme ajustable en intra-entreprise.
• Le data engineering et sa fonction dans l’entreprise
• Qu’est-ce qu’un data lake et quelles sont ses briques
• Manières de stocker la donnée : SQL vs NoSQL
• Technologies de stockage : HDFS, GCS, S3, Azure Data Lake Storage
• Orchestration et ingestion avec un ETL
• Data processing avec Spark, Flink et Hadoop
• Data lineage et data management
• Gestion des accès et de la sécurité
• Analyser sa donnée avec des outils de data analytics
• Proposer et documenter une architecture (description visuelle, RFC)
• Monitorer et gérer les performances du data lake
• Mise en place de principes de data gouvernance
Les outils que vous manipulerez tout au long de la formation.
Cette formation est éligible aux principaux dispositifs de financement de la formation professionnelle. Notre équipe vous accompagne dans le montage du dossier.
OPCO — Prise en charge par votre opérateur de compétences au titre du plan de développement des compétences de votre entreprise.
Plan de développement — Inscription dans le plan de formation de votre entreprise, en direct avec votre service RH ou formation.
Financement personnel — Tarifs adaptés pour les indépendants et auto-entrepreneurs, paiement en plusieurs fois possible.
La formation dure 2 jours (14 heures) et se déroule en présentiel ou à distance, en groupe limité à 7 participants pour préserver l'interactivité et la pratique.
Pour suivre cette formation dans de bonnes conditions, il est recommandé d'avoir : Culture générale data ou SI; Notions de base sur les bases de données.
La formation aborde HDFS, Amazon S3, Azure Data Lake Storage et Google Cloud Storage, ainsi que les moteurs de traitement comme Spark, Flink et Hadoop.
Oui, elle propose une méthodologie de choix technologique et apprend à proposer et documenter une architecture répondant à un cas d'usage.
Inscrivez-vous à l'une de nos sessions programmées, ou optez pour une formation intra sur mesure adaptée à votre équipe.
Une question ? Appelez-nous au 01.72.25.40.82
Cette formation Data Lake vous donne en 2 jours une vision complète des architectures et choix technologiques. Vous abordez les concepts (lake vs warehouse vs lakehouse), les principales briques (stockage objet, formats Parquet/Delta/Iceberg, moteurs SQL, catalogue), ainsi que les enjeux de gouvernance et de qualité. La formation s’appuie sur des cas réels d’entreprise. Idéale pour architectes data, chefs de projet et data engineers cadrant ou faisant évoluer leur plateforme data.