foret aleatoire python

Forêt aléatoire avec python et scikit-learn

Emmanuel Jakobowicz Mis à jour le : 27 avril 2021 méthode, python 1 Comment

Une forêt aléatoire ou random forest est une méthode d’apprentissage supervisé extrêmement utilisée par les data scientists. En effet, cette méthode combine de nombreux avantages dans le cadre d’un apprentissage supervisé. Dans cet article, je vais vous présenter l’approche et une application avec le langage python et le package de machine learning, scikit-learn.

anaconda-python

Installer Anaconda pour python pour vos projets data

Emmanuel Jakobowicz Mis à jour le : 22 avril 2021 méthode, python 1 Comment

L’utilisation d’Anaconda pour l’installation de python pour la data science permet de simplifier un certain nombre d’étapes dans la création de vos projets python pour la data science.

Dans cet article, je vais commencer par décrire les principes d’Anaconda, puis je m’attacherai à l’installation d’Anaconda pour Microsoft Windows et je terminerai par l’ajout de package et la création d’un environnement de développement avec Anaconda.

python en data science

De nouveaux parcours de formation autour de python et de la data science

stat4decision Mis à jour le : 6 avril 2021 actualités, annonce Laissez un commentaire

Stat4decision vous propose de nouveaux parcours de formation adaptés aux besoins du marché de la data. Nos parcours sont basés sur un maximum de pratique avec un encadrement permanent par des experts.
Nos parcours courts vous permettent d’acquérir des compétences précises pouvant être exploitées en entreprise.

simul-distribution

Modéliser une distribution avec Python

Maël Fabien Mis à jour le : 21 septembre 2021 méthode 7 Comments

La modélisation de la distribution des données (distribution fitting en anglais) est le fait de trouver les paramètres de la loi de probabilité (ou de plusieurs lois candidates) qui correspond aux données que l’on cherche à modéliser. Dans cet article, nous illustrons ce concept avec un exemple en Python.