Vous avez des données avec une colonne par variable et vous voulez décrire ces données. La première étape consiste en l’utilisation de statistiques descriptives univariées vous permettant d’obtenir des informations sur chaque variable séparément. Il s’agit ici de statistique sur des échantillons , ils permettent (si l’échantillon est représentatif) d’estimer un paramètre sur la population.
Petite révolution dans le monde du logiciel R
Fin juin 2015, une annonce est passée assez inaperçue dans le monde de la data science mais celle-ci annonce un changement impressionnant dans le développement du logiciel R : la création par la Linux foundation du R consortium, un consortium rassemblant de nombreux acteurs, avec Microsoft aux avant-postes, visant à promouvoir l’utilisation de R et à faciliter son adoption. Commençons …
Le box-plot ou la fameuse boîte à moustache
Vous avez forcément entendu parler du box-plot que l’on appelle aussi boîte à moustache pour sa forme originale.
Ce graphique tout simple permet de résumer une variable de manière simple et visuel, d’identifier les valeurs extrêmes et de comprendre la répartition des observations.
Bienvenue à tous
Bonjour, Bienvenue sur le blog de STAT4DECISION, il servira à vous tenir informé des nouveautés, des actualités et des informations originales sur le monde de l’analyse de données, du big data, de l’open data et de la data visualisation, mais aussi à poster des articles sur des méthodes d’analyse. Nous nous ferons un plaisir d’échanger avec vous afin de mieux …