O Toyota Research Institute (TRI) está obtendo um progresso significante no campo de aprendizado robótico, apresentando um sistema capaz de ensinar um robô novas habilidades durante a noite. Essa inovação é um avanço importante, já que os métodos tradicionais de aprendizado de máquina requerem milhões de casos de treinamento, o que não é viável em cenários físicos de aprendizado robótico.
O sistema desenvolvido pelo TRI combina técnicas tradicionais de aprendizado de robôs com modelos de difusão, semelhantes aos utilizados em modelos de IA generativa. Com esse método, o TRI treinou com sucesso robôs em mais de 60 habilidades diferentes. No entanto, ainda existem limitações nos modelos existentes. Embora os grandes modelos de linguagem sejam utilizados para fornecer inteligência cognitiva aos robôs, permitindo que eles compreendam comandos de alto nível, eles enfrentam desafios em tarefas específicas, como conectar um dispositivo USB ou pegar um lenço de papel.
O objetivo do TRI é preencher essa lacuna, desenvolvendo um sistema capaz de programar habilidades que possam ser utilizadas em ambientes diversos e não estruturados. Isso é crucial, pois os robôs frequentemente enfrentam dificuldades em ambientes menos estruturados. Por exemplo, navegar em um armazém é mais fácil do que navegar em uma estrada ou em uma casa. O TRI concentra-se em criar robôs que possam se adaptar a mudanças em seu ambiente, como mover móveis ou lidar com bagunças inesperadas.
O processo de ensino para robôs começa com a teleoperação, onde um operador humano controla remotamente o robô por meio de demonstrações. O sistema coleta dados de várias fontes, incluindo visão e feedback de força, para obter uma compreensão abrangente da tarefa. O feedback de força é especialmente crucial para tarefas que exigem manuseio adequado, como segurar corretamente uma ferramenta.
Após o treinamento inicial, as redes neurais do sistema continuam aprendendo durante a noite. Isso é alcançado por meio de uma política de difusão, que gera o comportamento do robô representando-o como um processo condicional de difusão de redução de ruído. Resultados promissores foram observados em experimentos, com taxas de sucesso em tarefas envolvendo percepção tátil, como virar panquecas e enrolar massa, aumentando significativamente.
Em conclusão, os avanços do TRI no aprendizado robótico estão expandindo os limites do que os robôs podem alcançar. Ao ensinar robôs novas habilidades durante a noite, os pesquisadores estão nos aproximando de um futuro onde os robôs possam se adaptar e aprender em cenários do mundo real.
Fontes:
– Artigo do TechCrunch, “Toyota’s TRI shows off advances in robot learning, talks plans to productize research”
– Crédito da imagem: Toyota Research Institute