Nvidia a mis au point ce qu'il présente comme le premier système d'apprentissage profond qui peut enseigner à un robot à accomplir une tâche en observant simplement les actions d'un humain.

au sommaire


    Dans la perspective de la cobotique, simplifier la communication entre les humains et les robots censés les assister est un enjeu déterminant. Une équipe de chercheurs du fabricant de processeurs graphiquesprocesseurs graphiques Nvidia annonce avoir accompli de sérieux progrès dans ce domaine grâce à la mise au point d'un système d'apprentissage capable d'enseigner à un robot comment reproduire une tâche en observant simplement un humain.

    Lorsque le robot observe une tâche, il génère une description lisible par un humain des différentes étapes nécessaires à sa réalisation. L'opérateur peut alors corriger les éventuelles erreurs dans l'interprétation du robot avant qu'il ne s'exécute. Comme les chercheurs l'expliquent dans leur article scientifique, le système de perception fonctionne avec n'importe quel objet physiquephysique dont la forme peut être retranscrite en 3D sous forme cuboïde.

    Trois réseaux neuronaux se coordonnent

    Pour parvenir à ce résultat, Nvidia combine le travail de trois réseaux neuronaux d'apprentissage profondapprentissage profond. Le premier réseau détecte la position des objets et utilise un réseau neuronal convolutif pour les spatialiser. Le deuxième réseau neuronal se charge de créer le plan de reproduction de la tâche observée en déterminant une relation entre les objets. Pour finir, un troisième réseau neuronal s'attelle à guider le robot pour exécuter la tâche.

    Pour le moment, les tâches reproduites sont encore assez simples. Mais la base du système d'apprentissage va permettre d'évoluer vers des scénarios plus complexes, assurent les chercheurs.

    En vidéo : des robots apprennent la voltige aérienne par imitation