Au Toyota Research Institute (TRI), les chercheurs ont développé une méthode innovante qui permet aux robots d’apprendre de nouvelles compétences du jour au lendemain. Cette avancée dans l’apprentissage des robots est réalisée en combinant des techniques d’apprentissage traditionnelles avec des modèles de diffusion. TRI a réussi à entraîner avec succès des robots dans 60 compétences en utilisant cette méthode, qui repose sur le principe que les modèles existants seuls ne peuvent pas résoudre le problème d’enseigner aux robots des tâches spécifiques nécessitant une interaction physique.

L’avantage de cette méthode est qu’elle permet de programmer des compétences qui peuvent fonctionner dans divers environnements, surmontant ainsi le défi pour les robots de fonctionner dans des environnements non structurés. Cela est particulièrement précieux dans des scénarios tels que les foyers, où les systèmes robotiques doivent s’adapter aux conditions changeantes et naviguer à travers des obstacles tels que les meubles ou le désordre laissé par les humains.

Traditionnellement, les robots dépendaient de la programmation pour anticiper et gérer divers cas limites et déviations. Cependant, la nouvelle approche vise à créer des systèmes « généralistes » qui peuvent s’adapter et apprendre de nouvelles tâches au lieu d’être limités à effectuer une seule tâche de manière répétée.

Pour enseigner de nouvelles compétences aux robots, TRI utilise initialement la téléopération, où une personne démontre la tâche souhaitée tandis que le robot imite les actions. Ce processus implique plusieurs heures de répétition et peut être amélioré en transmettant une rétroaction de force entre le robot et l’opérateur, ce qui permet une meilleure compréhension de l’interaction du robot avec le monde.

Le système tire parti de données provenant de différents capteurs, tels que la vision et la rétroaction de force, pour développer une compréhension globale de la tâche. Par exemple, le toucher est crucial pour des tâches telles que retourner des crêpes et pétrir de la pâte, car il augmente considérablement le taux de réussite.

Une fois que la phase de formation initiale est terminée, les réseaux neuronaux des robots continuent de s’entraîner pendant la nuit, perfectionnant les compétences apprises pendant la téléopération. L’objectif est que le robot maîtrise complètement la compétence lorsque les chercheurs retournent au laboratoire le lendemain.

Cette avancée dans l’apprentissage des robots est une étape importante vers la création de robots capables d’apprendre et de s’adapter à de nouvelles tâches dans des environnements réels. En combinant des techniques d’apprentissage traditionnelles avec des modèles de diffusion, TRI repousse les limites de ce que les robots peuvent accomplir, éliminant ainsi le besoin d’une formation approfondie et permettant une acquisition plus rapide de compétences.

Sources :
– TechCrunch Disrupt
– Toyota Research Institute