Vous avez sûrement entendu le terme développeur full-stack ces derniers temps et vous vous demandez qui se cache derrière. Voici quelques explications.
Bonne année 2016 à tous
Toute l’équipe de STAT4DECISION se joint à moi pour vous souhaiter une excellente année 2016 passionnante et innovante.
Nous revenons très vite avec de nouveaux articles et de nouvelles formations en analyse de données, data science, big data…
Emmanuel Jakobowicz
CEO STAT4DECISION
L’approche PLS avec R – Intoduction
L’approche PLS est une méthode permettant de modéliser des relations entre des variables observés et des construits non observés souvent appelés variables latentes. Cette présentation introduit l’utilisation de l’approche PLS avec R et le package plspm.
Régression PLS, une méthode pour vous ?
Vous avez déjà entendu parler de la régression PLS, des moindres carrés partiels, de la régression Partial Least Square. Ces termes désignent une méthode statistique qui a vu le jour au début des années 1980 et qui connaît aujourd’hui de nombreuses applications dans des domaines extrêmement variés.
Il ne s’agit pas ici de faire un cours sur la régression PLS mais de mettre en avant ses forces et faiblesses tout en évoquant les moyens de la mettre en oeuvre.
Le langage de la data science
Quel langage choisir ? Est-ce que le choix de R est automatique ? Faut-il préférer un langage propriétaire ou un langage libre ? Est-ce qu’il faut choisir un langage générique ou un langage orienté pour le calcul scientifique ? Autant de questions que tout data scientist se pose lors de la mise en place d’un projet ou lors de l’apprentissage de nouvelles techniques.
Comme vous l’imaginez, il n’y a pas une réponse unique à toutes ces questions. Voici quelques éléments de réponse.
Quelles statistiques utiliser pour décrire une variable ?
Vous avez des données avec une colonne par variable et vous voulez décrire ces données. La première étape consiste en l’utilisation de statistiques descriptives univariées vous permettant d’obtenir des informations sur chaque variable séparément. Il s’agit ici de statistique sur des échantillons , ils permettent (si l’échantillon est représentatif) d’estimer un paramètre sur la population.
Petite révolution dans le monde du logiciel R
Fin juin 2015, une annonce est passée assez inaperçue dans le monde de la data science mais celle-ci annonce un changement impressionnant dans le développement du logiciel R : la création par la Linux foundation du R consortium, un consortium rassemblant de nombreux acteurs, avec Microsoft aux avant-postes, visant à promouvoir l’utilisation de R et à faciliter son adoption. Commençons …
Le box-plot ou la fameuse boîte à moustache
Vous avez forcément entendu parler du box-plot que l’on appelle aussi boîte à moustache pour sa forme originale.
Ce graphique tout simple permet de résumer une variable de manière simple et visuel, d’identifier les valeurs extrêmes et de comprendre la répartition des observations.
Bienvenue à tous
Bonjour, Bienvenue sur le blog de STAT4DECISION, il servira à vous tenir informé des nouveautés, des actualités et des informations originales sur le monde de l’analyse de données, du big data, de l’open data et de la data visualisation, mais aussi à poster des articles sur des méthodes d’analyse. Nous nous ferons un plaisir d’échanger avec vous afin de mieux …