Notre article précédent sur l’apprentissage automatique (Machine Learning : l’explosion des possibles – Planète ROBOTS n° 51) a présenté quelques cas d’usage de cette technologie.
La question qui suivra sera celle de savoir pourquoi une telle explosion des possibles a lieu aujourd’hui ?
Comme souvent, ce n’est pas une question d’imagination. Le rêve d’une machine apprenant seule ou active lors de son apprentissage était présent chez les premiers ingénieurs qui dès 1940 ont inventé un domaine qui ne s’appelait pas encore l’intelligence artificielle.
Un triple avènement a eu lieu ces dernières années. Des algorithmes dédiés et performants sont apparus, des processeurs spécifiques ont été mis au point, et, depuis 20 ans, Internet participe à l’étiquetage massif des objets du monde réel.
Nouvelle étape dans l’apprentissage des machines : les chercheurs du Massachusetts Institute of Technology (MIT) ont créé un nouveau langage de programmation, le C-Learn.
Traditionnellement, les machines sont soit programmées par un humain, ce qui prend du temps, soit, apprennent à réaliser une tâche à partir d’une démonstration, ce qui est difficilement généralisable.
Le C-Learn permet à des personnes qui ne sont pas des programmeurs d’enseigner des tâches au robot, mais également, une fois cette tâche apprise par un premier robot, de transférer cette connaissance à un second, même si celui-ci a une architecture différente.
La méthode a été testée avec Optimus, un robot auquel les chercheurs ont appris à ouvrir des portes et transporter des objets. Une fois que la machine maîtrisait ces activités, cet apprentissage a été transféré à un robot Atlas.
Les actions de l’opérateur humain se réduisent alors à :
- fournir une base de connaissances sur la façon de tenir les objets,
- et utiliser une interface pour montrer une seule fois au robot la tâche à réaliser. Cette séquence est découpée en tâches élémentaires correspondant aux unités de la base de connaissance de manipulation.
L’entreprise Open AI, basée à San Francisco, cherche à rapprocher l’apprentissage des machines de celui des humains. A cette fin, elle a remarqué que nous apprenons certes de nos succès, mais également de nos erreurs. Quand nous échouons, nous collectons également des informations, ce qui nous rend plus efficaces pour adopter un comportement légèrement différent à l’essai suivant.
Open AI a donc publié un algorithme open source nommé Hindsight Experience Replay (HER). Celui-ci recycle les échecs en succès ! Il récupère les données des tentatives malheureuses et défini l’état final comme étant celui que la machine devait atteindre. L’échec concoure alors à l’apprentissage.
Un autre avantage de cette solution est, selon l’équipe de recherche, la plus grande simplicité de programmation de la récompense, ainsi que de la fonction qui mène au succès. Au lieu de devoir définir celle-ci en une fois, elle l’est progressivement, en faisant la différence entre le succès complet et ce petit succès qu’est… un échec.
Les techniques d’apprentissage sont donc en pleine mutation, se rapprochant d’un comportement que l’on compare à celui de l’humain.
Mais pour mettre en œuvre ces nouvelles techniques, il faut les moyens matériels correspondant.
A ce jeu-là également, des chercheurs du MIT ont réalisé des prouesses en améliorant une puce neuromorphique.
Comme son nom l’indique, l’architecture de ce composant ressemble à celle de nos neurones. Là où une puce traditionnelle ne gère que deux valeurs de la puissance électrique, l’une correspondant à la valeur « 0 » et l’autre à la valeur « 1 » du monde binaire, une puce neuromorphique utilise des signaux électriques d’intensité variable.
Elle a ainsi la possibilité de transmettre une quantité plus importante d’informations lors d’une modulation électrique.
L’innovation des chercheurs du MIT consiste à avoir créé une synapse artificielle.
Dans le monde du vivant, une synapse est une région de contact entre deux neurones. C’est à travers de celle-ci qu’ils communiquent, par la transmission d’un signal électrique porté par des ions.
Les chercheurs ont quant à eux créé cette synapse à partir de silicium. Elle permet de contrôler avec précision la force du courant électrique qui la traverse.
Utilisée dans le cadre d’un réseau neuronal destiné à reconnaître l’écriture manuscrite, le système a atteint une précision de 95 %.
Ce type de travaux permet d’envisager la production de puces neuromorphes qui pourront équiper nos ordinateurs et nos portables, pour des tâches d’apprentissage telles que la reconnaissance de forme.
Les universitaires ne sont évidemment pas les seuls à participer à cette quête. Du côté des industriels, IBM a dévoilé sa puce TrueNorth en 2014. Spécialiste des gros systèmes, l’entreprise a créé un « monstre » comptant plus d’un million de neurones et 268 millions de synapses.
Intel, premier fabricant mondial des semi-conducteurs, a présenté sa création, la puce Loihi. Avec un composant plus petit de « seulement » 130.000 neurones et 130 millions de synapses, l’industriel vise certainement une diffusion plus orienté vers le matériel grand public.
Ces puces, économes en énergie, utilisent des données pour apprendre : elles n’ont pas besoin d’être programmées de façon traditionnelle.
L’apprentissage en profondeur utilise lui aussi de grandes quantités de données mais se heurte à la difficulté de la généralisation, celle du passage d’un problème à un autre. L’intérêt de la puce neuromorphique est d’offrir a priori, un support matériel au sein duquel se réalise la formation du réseau de neurones. Selon ses fabricants, sur une tâche telle que la reconnaissance de chiffres, la puce consommerait beaucoup moins d’énergie qu’une autre technologie comme l’apprentissage profond par exemple.
[…] L’article dans son intégralité est paru dans Planète Robots n°52 du 1er juillet 2018