Le traitement du Langage Naturel est un des domaines de recherche les plus actifs en science des données actuellement. C’est un domaine à l’intersection du Machine Learning et de la linguistique. Il a pour but d’extraire des informations et une signification d’un contenu textuel.
4 outils data science qui ont marqué début 2019
Cette première moitié de l’année a été extrêmement riche en nouveautés et nous a permis de confirmer la force d’un certain nombre d’outils dans le domaine de la data science et du développement. J’en ai sélectionné 4 qui me paraissent spécialement intéressants.
Que propose Microsoft pour la Data Science ?
Suite à la parution du quadrant Gartner de 2019, je vous propose de rentrer dans le détail de l’offre Microsoft pour la Data Science.
Qui sont les utilisateurs de Python en data science ?
La python software foundation vient de publier une enquête sur les utilisateurs de Python. Nous étudions les utilisateurs en data science
Nouveau classement des plateformes data science 2019
Le cabinet Gartner vient de sortir son classement ou plutôt son cadran (magic quadrant) sur les plateformes data science et machine learning pour 2019.
Cette représentation des différents logiciels de data science est devenu une habitude dans la data science. Analysons ensemble ce rapport 2019.
Liste des packages Python pour la data science
Le langage Python a retrouvé une nouvelle jeunesse depuis quelques années grâce à l’essor de la data science.
Comme je le disais dans l’article sur les langages de la data science, Python a pris une réelle valeur grâce au fait qu’il est à la fois un langage généraliste mais aussi qu’il possède des packages Python spécifiquement adaptés à la data science. Que ce soit pour la data science, la statistique, l’analyse de données ou encore la data visualisation, Python offre une alternative intéressante à R.
Je vous présente ici une liste de packages Python extrêmement utiles pour les data scientists désirant utiliser Python.
Les licences d’utilisation en data science
Cet article fait suite à de nombreux échanges liés aux licences d’utilisation dans le logiciel libre. Même s’il s’agit d’un thème plutôt juridique il est central pour de nombreux acteurs de la data science. Je parle ici des licences liées aux outils logiciels et non des licences liées aux documents (comme Creative Commons).
Le machine learning pour tous
Voici quelques temps que le terme machine learning est présent dans le monde de la data. De plus en plus d’utilisateurs métiers, de managers, de dirigeants entendent ce mot. Il est souvent associé au big data, à l’intelligence artificielle… Je profite donc de cet article pour vous en présenter les grandes lignes sans formules ni trop de technicité.
IBM-SPSS, KNIME, RapidMiner et SAS toujours leaders parmi les data science platforms
La dernière étude du cabinet Gartner compare les data science platforms. On s’attendait à ce nouveau nom, mais y a-t-il de réelles nouveautés ?
Et si vous deveniez data scientist ?
Comme beaucoup, vous rêvez de devenir data scientist. Une fois que vous l’avez dit vous vous retrouvez face à un mur vertigineux et une première question périlleuse : un data scientist, c’est quoi ?