Lorsque vous traitez des données, vous avez besoin de pouvoir les comparer, d’analyser leur évolution dans le temps, … Vous avez donc besoin de faire appel à la temporalité et fonctions de time intelligence.
Les fonctions itératives : intérêt et utilisation
Cet article présente les fonctions itératives et leur application à l’aide de Microsoft Power BI.
Voilà, des dashboards à partir de vos Jupyter Notebooks
Jupyter Voilà, c’est l’outil de l’écosystème Jupyter pour créer des dashboard interactifs et des applications web à partir de vos Notebooks.
Faire une régression logistique avec python
Dans cet article nous allons appliquer une régression logistique avec python en utilisant deux packages très différents : scikit-learn et statsmodels. Nous verrons les pièges à éviter et le code associé.
Approche PLS (PLS Path Modeling)
L’approche PLS appelée aussi PLS Path Modeling ou PLS-SEM est une méthode utilisée entre autres pour l’analyse de la satisfaction.
Traiter différents types de colonnes avec scikit-learn et ColumnTransformer
La classe ColumnTransformer de scikit-learn permet de traiter de manières différentes les colonnes d’un jeu de données, notamment les variables qualitatives et quantitatives.
Qu’est-ce que le nouvel opérateur morse de Python 3.8 ?
Python 3.8 se dote d’un nouvel opérateur, l’opérateur morse qui combine allocation et test.
Traitement Automatique du Langage Naturel en français (TAL / NLP)
Le traitement du Langage Naturel est un des domaines de recherche les plus actifs en science des données actuellement. C’est un domaine à l’intersection du Machine Learning et de la linguistique. Il a pour but d’extraire des informations et une signification d’un contenu textuel.
Modéliser une distribution avec Python
La modélisation de la distribution des données (distribution fitting en anglais) est le fait de trouver les paramètres de la loi de probabilité (ou de plusieurs lois candidates) qui correspond aux données que l’on cherche à modéliser. Dans cet article, nous illustrons ce concept avec un exemple en Python.
Le tri à plat et le tri croisé avec R et Python
Le tri à plat et le tri croisé sont des opérations de base pour la description des données. Nous proposons une description de ces opérations et des exemples de code en R et en Python.