Machine learning : l’explosion des possibles

Watson d'IBM
Watson d'IBM

Ce qui est appréciable, avec le machine learning, c’est que ce terme parle à chacun.

Effectivement, il s’agit d’apprendre aux machines.

Évidemment, les choses deviennent un peu plus compliquées quand on rentre dans le détail : qu’entend on par « apprendre », et comment s’y prend on ?

Également nommée « apprentissage automatique » en français, le machine learning est une branche de l’intelligence artificielle (IA).

Un des buts de l’IA est d’étiqueter la complexité. Quand nous regardons un paysage, notre cerveau a la capacité naturelle de distinguer une montagne, la rivière qui coule à ses pieds et les maisons sur les rives, pour nous permettre d’utiliser ces informations. L’IA a le même propos, pour de multiples applications.

Mais la réalité est complexe. Il serait impossible d’écrire un programme tenant compte de toutes les cas de figure que la machine peut rencontrer dans le monde réel.

L’apprentissage automatique veut résoudre ce problème en apprenant à apprendre à la machine.

Les champs d’application sont… l’ensemble des situations réelles.

Parmi les plus médiatiques, à juste titre, figure celui des analyses médicales.

Le célèbre super-calculateur Watson d’IBM participe au séquençage génétique et à la recherche anti-cancer. Son IA peut prédire la survenue des attaques cardiaques 10 ans à l’avance.

Human Diagnosis Project
Human Diagnosis Project

Le projet « Human Diagnosis » ou « Human Dx » (1) propose une application smartphone à travers laquelle les médecins peuvent demander confirmation de leur diagnostique.

L’objectif du projet est d’être en capacité de fournir aux médecins généralistes une assistance pour les pathologies spécifiques pour lesquelles il devrait être fait appel à un spécialiste. Il prend toute son importance dans un pays tel que les Etats-Unis où le recours à un médecin spécialiste, pour les 30 millions d’Américains non assuré est très limité. Il faut attendre des mois pour une consultation par un spécialiste travaillant dans un hôpital public. Des études ont montré que plus d’un quart de ces consultations pouraient être remplacées par des consultations en ligne entre médecins.

Human Dx travaille à partir des diagnostiques réalisés par les médecins et les images et résultats d’examen des patients. Les données sont transmises à des spécialistes ou à un réseau de médecins. L’IA agrège ensuite les réponses dans un rapport unique.

Human Diagnosis Project
Human Diagnosis Project

C’est un exemple d’apprentissage positif : les machines apprennent à partir d’expériences réussies. Pour améliorer le vol autonome des drones, les chercheurs de l’université Carnegie Mellon  ont eu l’idée originale des les faire se crasher (2). Ils ont programmé un drone pour entrer en collision et ont enregistré plus de 11.000 « accidents ». Les données ont alimenté un réseau de neurones d’apprentissage profond (deep learning), avec d’autres issues de trajectoires réussies sur les mêmes parcours.

Bien que cela soit contraire à nos habitudes d’enseigner aux machines, il a ainsi été démontré qu’il était plus efficace de leur apprendre à conserver une trajectoire par « la peur » de la chute que par la recherche du succès.

Là où un apprentissage positif nécessiterait de simuler toutes les trajectoires réussies sur un parcours, celui par le crash ne demande qu’à faire apprendre les cas, plus rares, où les manœuvres conduisent à un accident.

Après 11.500 collisions, le drone était capable de voler en autonomie, mêmes en présence d’obstacles mobiles et de portes vitrées ! Ses résultats ne sont pas (encore) aussi bons que ceux avec un pilote humain, sauf dans un environnement complexe (couloir étroit ou avec des chaises).

Vision du drone
Le monde vu par le drone

Techniquement, il faut remarquer que cet apprentissage ne se base pas sur des images fixes, mais sur des flux vidéo. De plus, le robot utilise une vision binoculaire. Pas au sens de celle humaine, qui nous permet d’acquérir une image en trois dimensions, mais plus proche de celle des oiseaux, dont l’aire visuelle couverte par un œil ne recouvre par celle de l’autre.

Dans le cas du drone, les deux images sont comparées en permanence. Celle qui correspond à la plus faible probabilité d’accident indique la direction au robot.

Un intérêt collatéral de l’apprentissage automatique est que, destiné à adapter la machine à des contextes variés, il peut donner à celle-ci une forme de créativité.

Les algorithmes d’apprentissage automatique aboutissant à une activité créatrice font appel à l’apprentissage profond. Les réseaux neuronaux sont entraînés sur d’importantes bases de données. Une fois cette phase d’apprentissage réalisée, le réseau est activé en sens inverse. Par exemple, un réseau est alimenté à partir de dizaines de milliers d’images de chats pour lui apprendre à reconnaître cet animal en toute circonstance. Par la suite, le réseau affectera l’étiquette « chat » à toute image présentant cet animal, quelle que soit sa posture. L’activation du réseau « en sens inverse », par une étiquette « chat », permettra au réseau de générer une image d’un félin, souvent onirique.

La machine n’est pas limitée dans ses domaines d’invention.

Des chercheurs du Georgia Institute of Technology ont fourni près de 5.000 partitions, de Beethoven à Lady Gaga à leur robot, Shimon.

Shimon
Shimon

A partir de cette base, la machine a produit ses propres compositions (3) : il suffit de lui fournir les quatre premières mesures pour lancer son travail d’écriture. D’après l’un de ses créateurs, le Dr Mason Bretan, la pensée de Shimon ressemble à celle d’un musicien humain, qui ne se limite pas à la lecture de la note suivante, mais présente une compréhension globale de la structure de la composition : « Lorsque nous jouons ou écoutons de la musique, nous ne pensons pas seulement à la note suivante. Un artiste a une plus grande idée de ce qu’il essaie d’accomplir dans les prochaines mesures ou plus tard dans la pièce.

[…] L’article dans son intégralité est paru dans Planète Robots n°51 du 1er mai 2018

Translate »