simul-distribution

Modéliser une distribution avec Python

Maël Fabien Mis à jour le : 21 septembre 2021 méthode 8 Comments

La modélisation de la distribution des données (distribution fitting en anglais) est le fait de trouver les paramètres de la loi de probabilité (ou de plusieurs lois candidates) qui correspond aux données que l’on cherche à modéliser. Dans cet article, nous illustrons ce concept avec un exemple en Python.

python en data science

Liste des packages Python pour la data science

Emmanuel Jakobowicz Mis à jour le : 21 mai 2018 actualités, méthode Laissez un commentaire

Le langage Python a retrouvé une nouvelle jeunesse depuis quelques années grâce à l’essor de la data science.

Comme je le disais dans l’article sur les langages de la data science, Python a pris une réelle valeur grâce au fait qu’il est à la fois un langage généraliste mais aussi qu’il possède des packages Python spécifiquement adaptés à la data science. Que ce soit pour la data science, la statistique, l’analyse de données ou encore la data visualisation, Python offre une alternative intéressante à R.

Je vous présente ici une liste de packages Python extrêmement utiles pour les data scientists désirant utiliser Python.

La suite

licences logiciel libre

Les licences d’utilisation en data science

Emmanuel Jakobowicz Mis à jour le : 6 juillet 2018 méthode Laissez un commentaire

Cet article fait suite à de nombreux échanges liés aux licences d’utilisation dans le logiciel libre. Même s’il s’agit d’un thème plutôt juridique il est central pour de nombreux acteurs de la data science. Je parle ici des licences liées aux outils logiciels et non des licences liées aux documents (comme Creative Commons).

La suite

machine learning image

Le machine learning pour tous

Emmanuel Jakobowicz Mis à jour le : 31 mars 2017 méthode Laissez un commentaire

Voici quelques temps que le terme machine learning est présent dans le monde de la data. De plus en plus d’utilisateurs métiers, de managers, de dirigeants entendent ce mot. Il est souvent associé au big data, à l’intelligence artificielle… Je profite donc de cet article pour vous en présenter les grandes lignes sans formules ni trop de technicité.

La suite

Comparaison python et R

Faire une régression linéaire avec R et avec python

Emmanuel Jakobowicz Mis à jour le : 6 octobre 2020 méthode 9 Comments

R et python s’imposent aujourd’hui comme les langages de référence pour la data science. Dans cet article, je vais vous exposer la méthodologie pour appliquer un modèle de régression linéaire multiple avec R et python. Il ne s’agit pas ici de développer le modèle linéaire mais d’illustrer son application avec R et python.

La suite