Calendrier des conférences data science, Python, R…

stat4decision Mis à jour le : 29 juin 2026 actualités 1 Comment

Calendrier des conférences dans le domaine de la data science et de ses langages de programmation (R, Python et Julia)

Les bonnes pratiques Python : écrire du code robuste, lisible et durable

stat4decision Mis à jour le : 5 septembre 2025 méthode, python Leave a Comment

Python s’est imposé comme un langage incontournable dans la science des données, l’intelligence artificielle et le développement logiciel. Mais entre un script rapide écrit dans un notebook et un projet professionnel, il existe un monde. Ce qui distingue les deux n’est pas seulement la complexité du code, mais la capacité à écrire un code robuste, lisible, maintenable et transmissible.

Skrub pour préparer efficacement vos données : une solution Python pour le machine learning

Emmanuel Jakobowicz Mis à jour le : 21 mai 2025 méthode, python Leave a Comment

Besoin de nettoyer et vectoriser rapidement vos données tabulaires pour du machine learning ?
On vous présente Skrub, une bibliothèque Python développée par l’équipe derrière scikit-learn.
Nettoyage automatique, jointures floues, vectorisation intelligente : en quelques lignes, vos données sont prêtes pour vos modèles.

Optimisation des performances sous PySpark pour l’analyse big data

stat4decision Mis à jour le : 21 mai 2025 méthode Leave a Comment

Découvrez les leviers essentiels pour optimiser vos jobs Spark : configuration, partitionnement, cache, bonnes pratiques de code… Un guide complet pour passer à l’échelle efficacement.

R et python – Comparaison détaillée de la manipulation de données entre R (dplyr) et Python (pandas)

stat4decision Mis à jour le : 26 juin 2026 méthode, python 2 Comments

Vous hésitez entre R et Python pour manipuler vos données ?
Découvrez les équivalences claires entre dplyr et pandas, avec du code et des explications pas à pas.
Un guide complet pour choisir le bon outil et passer facilement de l’un à l’autre.

Comment créer un logger structuré et efficace dans un projet Python

stat4decision Mis à jour le : 14 mars 2025 méthode Leave a Comment

Dans un projet python, la gestion des logs est essentielle pour assurer le suivi, le débogage et la maintenabilité du code, surtout dans les projets data. Un bon logger doit être centralisé, réutilisable, structurant et capable d’écrire dans des fichiers. Dans cet article, nous vous montrons comment mettre en place un logger adapté à un projet Python organisé en plusieurs …

La suite

Marre du VBA ? Passez à python !

Emmanuel Jakobowicz Mis à jour le : 13 février 2025 python, méthode Leave a Comment

Vous avez forcément entendu parler du box-plot que l’on appelle aussi boîte à moustache pour sa forme originale.

Ce graphique tout simple permet de résumer une variable de manière simple et visuel, d’identifier les valeurs extrêmes et de comprendre la répartition des observations.

La suite

Construire un nuage de points (scatter plot) avec Python

stat4decision Mis à jour le : 30 janvier 2025 python, méthode Leave a Comment

Les nuages de points, ou scatter plots, permettent d’analyser les relations entre deux variables numériques. Cet article explique comment générer des données, utiliser Matplotlib pour tracer ces graphes, et personnaliser les visualisations avec Seaborn. Il aborde également des techniques pour représenter des catégories, ajouter des lignes de régression, et annoter les points.

Essayez de coder en Python

stat4decision Mis à jour le : 12 janvier 2025 python Leave a Comment

JupyterLite est une version légère de Jupyter, permettant d’exécuter du code Python directement dans le navigateur, sans aucune installation nécessaire. Elle utilise Pyodide et WebAssembly pour exécuter Python localement. Bien que pratique pour partager des notebooks et réaliser des démos, ses fonctionnalités Python sont parfois limitées.

Introduction à Polars : Une Alternative Rapide à Pandas

stat4decision Mis à jour le : 30 janvier 2025 méthode, python Leave a Comment

Polars est une bibliothèque de manipulation de données rapide, conçue pour surpasser Pandas en performances. Grâce à son architecture en Rust et à l’utilisation du format Apache Arrow, Polars optimise le traitement des données volumineuses. Elle propose des fonctionnalités comme le multi-threading, une API paresseuse, et une manipulation intuitive via des expressions.

Page 1 of 4
1
2
3
...
4
→