Voici quelques temps que le terme machine learning est présent dans le monde de la data. De plus en plus d’utilisateurs métiers, de managers, de dirigeants entendent ce mot. Il est souvent associé au big data, à l’intelligence artificielle… Je profite donc de cet article pour vous en présenter les grandes lignes sans formules ni trop de technicité. Si vous voulez aller plus loin, vous pouvez suivre notre formation sur le sujet.

Le machine learning ou l’apprentissage automatique

Première question centrale : Qu’est-ce que le machine learning ?

En me basant sur les différentes définitions en voici une très courte : “champ d’étude qui donne aux ordinateurs la capacité d’apprendre sans être explicitement programmés”. Pour être plus clair, ce que fait le machine learning, c’est apprendre à résoudre un problème de manière automatique en utilisant les données. Dans le cadre du traitement de la donnée, il s’agit de construire un modèle obtenu directement à partir d’exemples. L’objectif des algorithmes de machine learning est de minimiser ce qu’on appelle l’erreur, c’est-à-dire de se tromper le moins possible.

Le machine learning se sépare en de nombreuses familles d’algorithmes permettant généralement de répondre à des questions précises. Nous allons énumérer certaines d’entre elles en utilisant des exemples d’implémentations. Il s’agit ici de vous présenter les principales approches et non d’être exhaustif.

L’apprentissage supervisé – prédire, prédire, prédire !

L’apprentissage supervisé va s’appliquer à des problèmes dans lesquels l’objectif est de prédire une valeur ou une appartenance.

On peut citer comme exemple, la retention de client. Afin d’assurer la fidélité de ses clients, une entreprise va utiliser ses données pour apprendre le profil des clients ayant renouveler ou no leurs services et grâce à ces exemples, elle va être capable de repérer les clients « à risque ». On trouve aussi des algorithmes supervisés dans la détection de spams de vos messagerie mais aussi dans la prévision de scores associés aux clients dans les assurances.

L’apprentissage non supervisé – rechercher des profils !

L’apprentissage non supervisé suppose qu’on ne connaît pas a priori quel sera le groupe d’appartenance de chaque individu.

On peut ici citer comme exemple chez Amazon la proposition d’achats venant d’autres utilisateurs. Dans ce cas, les utilisateurs d’Amazon sont répartis dans des groupes et par votre choix d’achat, on vous associera à un groupe de clients qui ont des achats proches du vôtre. Il s’agit juste de rassembler des clients dans des groupes qui ne sont pas prédéfinis (à la différence des clients fidèles / non fidèles du cas supervisé).

Quand fait-on du machine learning ?

La terminologie liée au machine learning est aujourd’hui assez large, je vais faire un petit tour des termes classiquement utilisés aujourd’hui :

Recommandation
Il s’agit de l’une des applications les plus connues. On cherche à recommander aux clients des contenus personnalisés. Dans les médias, ce sont des problèmes centraux (Netflix, Amazon…)
Clustering
On cherche à rassembler des objets similaires ensemble. Il s’agit de l’application la plus fréquente de l’apprentissage non supervisé.
Classification
Lorsqu’on fait de la reconnaissance d’image, de l’identification de clients (fidèles ou non)…, on fait de la classification. On est dans le cas où on a des exemples (par exemple des images d’animaux) et à partir de ces exemples on veut reconnaître efficacement une image de cet animal.
Régression
Lorsqu’on veut prédire une valeur numérique, on utlise des méthodes de régression. L’évolution des prix des TGV en fonction de la demande et d’autres paramètres est, entre autres, donnée par ce type d’algorithmes.
Détection d'anomalies
L’analyse de la fraude bancaire ou la détection de panne constitue un cas assez spécifique car le nombre d’exemple de fraude est toujours très faible relativement au nombre de non fraudes.
Deep learning
Le deep learning ne répond pas spécifiquement à une question, il s’agit plutôt d’un ensemble de méthodes permettant de répondre à certains problèmes très complexes. L’apprentissage profond va utiliser des réseaux de neurones afin de représenter le processus de choix. Il s’appliquera très bien à des problèmes d’apprentissage supervsé complexes notamment la reconnaissance d’images, il est utilisé dans les assistants personnels et est associé très souvent au terme d’intelligence artificielle car il permet de répondre à des questions qu’il n’aurait pas complètement appris par des exemples. On est néanmoins très loin de l’intelligence humaine.

Le machine learning est de plus en plus présent autour de nous sans que nous nous en rendions compte. Les algorithmes nous accompagnent au quotidien et leur compréhension est aujourd’hui centrale. Si vous voulez en savoir plus, vous pouvez soit suivre notre formation au techniques du machine learning qui vous permettra de rentrer dans les algorithmes, soit notre formation big data adaptée aux décideurs qui vous permettra de voir plus en détail les possibilités d’applications de ces nouvelles technologies dans votre domaine.

Le machine learning pour tous

Le machine learning ou l’apprentissage automatique

L’apprentissage supervisé – prédire, prédire, prédire !

L’apprentissage non supervisé – rechercher des profils !

Quand fait-on du machine learning ?

Recommandation

Clustering

Classification

Régression

Détection d'anomalies

Deep learning

Laisser un commentaire Annuler la réponse