Le Machine Learning, ou théorie de l’apprentissage, est une branche de l’intelligence artificielle. Se situant à la croisée de nombreux domaines scientifiques, il s’avère très puissant dans beaucoup de cas et constitue donc l’un des volets les plus actifs de la recherche scientifique.
INTELLIGENCE ARTIFICIELLE
Le Machine Learning, ou théorie de l’apprentissage ou encore apprentissage artificiel, est une branche de l’intelligence artificielle (IA). C’est un domaine profondément interdisciplinaire, à la croisée des statistiques, de l’automatique, de l’optimisation et de l’informatique. Il a pour objet de développer les capacités d’un système à améliorer ses performances via des interactions avec son environnement. Le Machine Learning a beaucoup à voir avec le Statistical Learning, la distinction entre les deux devenant de plus en plus floue et les apports de l’un à l’autre de plus en plus nombreux. Ces deux domaines étudient des problèmes supervisés (sortie a priori) ou non supervisés (pas de sortie a priori). Le Statistical Learning est une branche des statistiques. Il met l’accent sur les modèles et leurs interprétations, sur l’exactitude et l’incertitude due au modèle, alors que le Machine Learning met l’accent sur les applications à grande échelle et sur la précision de la prédiction.
UN NOMBRE D’APPLICATIONS INFINI
Les applications du Machine Learning, et conjointement du Statistical Learning, sont quasiment infinies. On peut en citer quelques-unes afin de pouvoir appréhender leur variété. Sont concernés par ces domaines: l’identification des facteurs de risques pour le cancer de la prostate, la prédiction pour une personne d’avoir une crise cardiaque en se basant sur des mesures démographiques, cliniques et alimentaires, la personnalisation d’un système de détection des e-mails, l’identification des numéros dans un code postal écrit à la main, le classement d’un échantillon de tissu dans une classe de cancers en se basant sur un profil génétique, l’établissement des relations entre mesures salariales et démographiques dans une base de données de population ou encore la recherche puis le ciblage de niches de marché les plus profitables (banque) ou au contraire les plus risquées (assurance). Naturellement, il existe, au sein du Machine Learning, un grand nombre de méthodes selon l’objectif visé.
APPRENTISSAGES SUPERVISÉ ET NON SUPERVISÉ
Le Machine Learning peut être amené à traiter deux types de problèmes différents. D’un côté, on dispose d’un ensemble d’observations X et de la présence d’une variable à expliquer Y observée conjointement. Il s’agit ici d’une modélisation ou d’un apprentissage supervisé. Il s’agit alors de trouver une fonction susceptible, au mieux selon un critère à définir, de reproduire Y en ayant observé X. Dans le cas contraire, si l’on ne dispose pas de la variable à expliquer, on parlera d’apprentissage non supervisé. L’objectif est alors généralement la recherche d’une typologie ou taxinomie des observations. C’est alors un problème de classification (clustering). En apprentissage supervisé, les observations sont déjà étiquetées et le but à atteindre est d’affecter une classe préexistante et apprise sur les données d’apprentissage à une nouvelle observation. Dans le cas de l’apprentissage non supervisé, aucune information n’est fournie sur l’appartenance des données à telle ou telle classe.
LES ÉTAPES DE L’APPRENTISSAGE
Qu’il soit supervisé ou non supervisé, l’apprentissage passe toujours par les mêmes étapes. Il faut d’abord collecter les données, les explorer, puis opérer une partition aléatoire de l’échantillon en prévision des étapes de choix du modèle, puis de choix et de certification de la méthode. Ensuite, il faut estimer le modèle pour un paramètre de complexité, paramètre qu’il faut optimiser en fonction de la technique d’estimation de l’erreur d’ajustement. On compare ensuite les modèles optimaux obtenus (un par méthode) en estimant l’erreur de prévision sur l’échantillon test ou, si la présence d’un échantillon test est impossible, on utilise ce que l’on appelle le critère de pénalisation de l’erreur. Il est peut-être nécessaire de recommencer les étapes précédentes afin de s’assurer de la robustesse du modèle obtenu. Ensuite, on choisit la méthode selon certains critères et l’on estime de nouveau le modèle avec la méthode choisie, et enfin on peut exploiter le modèle sur la base.
LES MÉTHODES UTILISÉES
Plus la recherche avance, plus le nombre de méthodes utilisées en théorie de l’apprentissage devient important. Il est donc difficile de toutes les présenter. On peut toutefois citer la régression logistique, qui est une méthode de classification procédant à une régression sur des attributs discrets. Elle a l’avantage de renvoyer un indicateur de confiance relatif à la prédiction. Une autre méthode importante est celle des réseaux de neurones, construits par analogie avec le fonctionnement des neurones du cerveau. Ils sont à l’origine des méthodes les plus innovantes aujourd’hui, celles des réseaux profonds ou Deep Learning. Enfin, les modèles de Markov sont des modèles de Machine Learning très utilisés si l’on souhaite prédire des séquences d’événements, par exemple des prédictions sur le langage afin d’améliorer les traducteurs automatiques. L’étendue du champ d’applications et les succès obtenus font du Machine Learning l’un des champs les plus innovants de la recherche scientifique.
À RETENIR
Le Machine Learning, ou théorie de l’apprentissage en français, est une branche de l’intelligence artificielle, à la croisée de nombreux domaines comme les statistiques, l’informatique ou l’automatique. Il a pour objet de développer les capacités d’un système à s’améliorer en interagissant avec son environnement. On distingue l’apprentissage supervisé de l’apprentissage non supervisé, pour lesquels de nombreux modèles ont été développés, comme la régression logistique, les réseaux de neurones (et les réseaux profonds) ou les modèles de Markov.