Le « Machine Learning » ou « Apprentissage Automatique » est aujourd’hui au cœur de l’attention notamment grâce à des projets d’innovations majeurs menés par les plus grandes firmes américaines. Vous utilisez certainement des outils faisant appels à l’apprentissage automatique dans votre vie quotidienne. Mais quelles sont les méthodes utilisées pour qu’une machine soit capable d’apprendre ?

 

Ce concept théorique est un sous-ensemble de l’intelligence artificielle (IA) visant à faire penser une machine de la même manière qu’un cerveau humain en faisant appel à des algorithmes et à des méthodes de mathématiques et de statistiques. Le Machine Learning consiste donc à apprendre à partir d’exemples pour pouvoir ensuite prédire des cas futurs.

Cette notion prend tout son sens avec l’apparition récente des Big Data mais ce n’est pas pour autant un concept récent : en effet, l’apprentissage automatique est basé sur des calculs statistiques effectués sur des grands nombres de données ; mais il y a plus de 20 ans, des ingénieurs d’IBM annonçaient déjà qu’un ordinateur pourrait, un jour, battre le plus grand champion d’échec en activité. Ce fut chose faite puisque l’ordinateur d’IBM Deep Blue, qui utilisait des méthodes de Machine Learning, gagne une partie d’échec face au champion de la discipline Garry Kasparov en 1997.

 

 Deep Blue d’IBM joue aux échecs contre Kasparov en 1997
Deep Blue d’IBM joue aux échecs contre Kasparov en 1997

 

Les méthodes de Machine Learning

Il existe différentes approches pour qu’un algorithme soit capable d’apprendre mais il y aura dans tous les cas, une phase dite « d’apprentissage » qui consiste à extraire des tendances générales à partir de ce qu’on connait déjà, et une phase dite de « prédiction » qui consiste à générer de l’information qui n’était pas présente au départ.

Nous pouvons séparer le Machine Learning en deux parties principales :

  • – L’apprentissage supervisé ou « Supervised Learning »
  • – L’apprentissage non supervisé ou « Unsupervised Learning »

 

Dans le cas de l’apprentissage supervisé, nous possédons déjà des informations sur les données obtenues grâce à des observations faites au préalable. L’objectif de l’algorithme est alors d’extraire des règles qu’il pourra utiliser dans la phase de prédiction. Les cas d’applications sont multiples : nous pouvons prédire le risque de cancer chez des individus à partir de leurs données personnelles, démographiques, et géographiques ou simplement créer un système anti-spam intelligent sur une boite de réception de courriels.

A l’inverse, dans le cas de l’apprentissage non supervisé, nous disposons d’aucune information sur les données. Le système doit générer des classes de similarités ou être capable de comparer des exemples.  L’algorithme peut donc créer des groupes d’exemples similaires. Ce type d’algorithme est principalement utilisé dans le cas où les données peuvent appartenir à un grand nombre de catégories. Par exemple, dans le cas où une entreprise de téléphonie veut établir un réseau dans une zone blanche, ces méthodes peuvent être utilisées pour définir l’emplacement optimal des nouvelles antennes à installer.

Toutes ces méthodes d’apprentissage automatique ont fait leurs preuves dans notre vie de tous les jours et leurs utilisateurs sont de plus en plus nombreux, même sans le savoir comme dans le cas de publicités ciblées ou de recommandations personnalisées sur le Web.

 

Nous pouvons nous assurer que ces systèmes vont continuer d’évoluer et profiter des nouvelles technologies pour accomplir des tâches encore plus complexes. Mais quelles sont les limites de ces systèmes d’apprentissage automatique ? La machine peut-elle réellement penser comme un cerveau humain ?

A propos de Laura WODLING