Ce lexique de la data science fournit des définitions essentielles sur divers termes tels que les algorithmes, l’apprentissage automatique, le big data, et les modèles d’intelligence artificielle. Il s’adresse à ceux qui cherchent à comprendre ces concepts techniques et leur impact sur l’analyse des données et les affaires.
KNIME : une plateforme data science 100 % open source et évolutive
KNIME est une plateforme open source leader en data science, lancée en 2004 et gratuite depuis 2006. Elle permet de préparer, analyser, et automatiser des workflows de données via une interface intuitive basée sur des nœuds. Ses capacités s’étendent à l’IA, le big data, et le NLP, tout en bénéficiant d’une communauté active.
L’évolution du Data Scientist à l’ère de l’IA
Le métier de Data Scientist, décrit comme « sexy » par la Harvard Business Review, reste crucial malgré les avancées en IA et l’automatisation. Ce rôle pluridisciplinaire allie mathématiques, informatique et connaissances métier, évoluant vers des compétences stratégiques, éthiques et créatives. Face à des défis croissants, l’adaptabilité et la formation continue sont essentielles.
Introduction à Polars : Une Alternative Rapide à Pandas
Polars est une bibliothèque de manipulation de données rapide, conçue pour surpasser Pandas en performances. Grâce à son architecture en Rust et à l’utilisation du format Apache Arrow, Polars optimise le traitement des données volumineuses. Elle propose des fonctionnalités comme le multi-threading, une API paresseuse, et une manipulation intuitive via des expressions.
Faites de ChatGPT un assistant data, et pas un décideur
ChatGPT s’avère être un assistant data remarquable en analyse poussée des données. Il est capable de nettoyage de données, d’analyses descriptives, voire de modélisation et de Machine Learning.
Dans cet article, nous décrivons une expérience dans laquelle nous avons mis à l’épreuve la pertinence et la solidité des analyses de données effectuées par ChatGPT.
Comprendre la différence entre pip, conda, venv, poetry…
Coder en python est associé à la notions d’environnements python. Plusieurs outils sont disponibles, lequel choisir ? venv, conda, poetry…
Créer une application web data en python : Streamlit vs Dash
Cet article offre un aperçu comparatif de Streamlit et Dash, deux outils puissants pour la création d’applications web interactives en Python, soulignant leurs forces respectives et aidant les développeurs à choisir l’outil le plus adapté à leurs besoins.
Migration de SAS vers Python : Étapes, Risques et Avantages
La migration des processus de traitement de données de SAS vers Python est un projet significatif pour toute organisation cherchant à moderniser ses opérations analytiques.
Cette transition ne concerne pas seulement un changement de langage de programmation, mais aussi une transformation culturelle et technique.
Cet article explore les étapes clés de cette migration, tout en mettant en lumière les risques potentiels et les avantages attendus.
Utiliser VSCode pour coder en python
VSCode est aujourd’hui la référence en terme d’environnement de développement.
Visual Studio Code (VScode) est un éditeur de code open source développé par Microsoft qui est devenu très populaire auprès des développeurs Python, nous vous expliquons pourquoi et comment le mettre en place.
Introduction au method chaining avec la librairie pandas
Cet article décrit l’approche de method chaining de la librairie pandas pour python. Ceci permettra de rendre votre code plus facilement maintenable et lisible.