Le tri à plat et le tri croisé sont des opérations de base pour la description des données. Nous proposons une description de ces opérations et des exemples de code en R et en Python.
Nouveau classement des plateformes data science 2019
Le cabinet Gartner vient de sortir son classement ou plutôt son cadran (magic quadrant) sur les plateformes data science et machine learning pour 2019.
Cette représentation des différents logiciels de data science est devenu une habitude dans la data science. Analysons ensemble ce rapport 2019.
Le langage Julia va-t-il remplacer R et Python ?
Le langage Julia est un langage adapté à la data science mais faut-il s’y plonger ? Quels en sont les principes ? Faisons un point sur son évolution.
Python 2 ou python 3 – la fin d’un dilemme
Le langage python est de plus en plus présent en data science. Une question récurrente durant ces 10 dernière années était le choix de la version du langage entre python 2 et python 3, est-ce bel et bien fini ?
Quelles différences entre les plateformes open data ?
La mise en place d’une politique open data doit se faire avec des moyens adaptés. La plateforme de partage des données en est un élément central.
Avec la généralisation de l’ouverture des données dans les administrations et dans les services publics, de nombreux décideurs se posent des questions sur la stratégie à observer concernant les plateformes open data et les outils de gestion des données. En effet, une politique d’ouverture des données fait apparaître de nombreux challenges dont le choix d’une plateforme open data reste un point important.
Python pour le data scientist disponible en librairie
Après des mois de travail, l’ouvrage python pour le data scientist – des bases du langage au machine learning est disponible. J’ai écrit cet ouvrage pour permettre à tous ceux intéressés par le traitement des données de s’initier au langage python.
Stat4decision sponsor de la conférence PyParis 2018
Stat4decision est sponsor et sera présent lors de PyParis 2018 du 14 au 15 novembre 2018 à l’EPITA.
Stat4decision sponsor des 7èmes rencontres R
Les 7èmes rencontres R ont lieu à Rennes en 2018 et stat4decision sera présent en tant que sponsor, venez nous y rencontrer.
Liste des packages Python pour la data science
Le langage Python a retrouvé une nouvelle jeunesse depuis quelques années grâce à l’essor de la data science.
Comme je le disais dans l’article sur les langages de la data science, Python a pris une réelle valeur grâce au fait qu’il est à la fois un langage généraliste mais aussi qu’il possède des packages Python spécifiquement adaptés à la data science. Que ce soit pour la data science, la statistique, l’analyse de données ou encore la data visualisation, Python offre une alternative intéressante à R.
Je vous présente ici une liste de packages Python extrêmement utiles pour les data scientists désirant utiliser Python.
De nouvelles formations Power BI
Nous proposons de nouvelles formations Power BI desktop afin de maîtriser tous les aspects de la business intelligence avec l’outil Power BI desktop de Microsoft.