W Instytucie Badawczym Toyoty (TRI) naukowcy opracowali innowacyjną metodę, która umożliwia robotom naukę nowych umiejętności w ciągu jednej nocy. Ten postęp w uczeniu robotów jest osiągany poprzez połączenie tradycyjnych technik nauki z modelami dyfuzji. Dzięki tej metodzie TRI odniosło sukces w szkoleniu robotów w 60 umiejętnościach, opierając się na założeniu, że same istniejące modele nie są w stanie rozwiązać problemu nauczania robotów konkretnych zadań wymagających interakcji fizycznej.
Zaletą tej metody jest możliwość programowania umiejętności, które mogą działać w różnych środowiskach, pokonując wyzwanie, jakim jest funkcjonowanie robotów w nieustrukturyzowanych środowiskach. Jest to szczególnie cenne w scenariuszach, takich jak domy, gdzie systemy robotyczne muszą dostosowywać się do zmieniających się warunków i nawigować wśród przeszkód, takich jak meble czy zamieszanie pozostawione przez ludzi.
Tradycyjnie roboty polegały na programowaniu w celu przewidywania i zarządzania różnymi wyjątkami i odstępstwami. Jednak nowe podejście ma na celu stworzenie „systemów ogólnego przeznaczenia”, które mogą adaptować się i uczyć nowych zadań, zamiast być ograniczone do wykonywania pojedynczego zadania w sposób powtarzający się.
Aby nauczyć roboty nowych umiejętności, TRI wykorzystuje początkowo teleoperację, gdzie osoba demonstruje pożądane zadanie, a robot naśladuje jej działania. Proces ten obejmuje wiele godzin powtórzeń i może być poprawiony przez przesyłanie informacji zwrotnej dotyczącej siły między robotem a operatorem, co umożliwia lepsze zrozumienie interakcji robota z otoczeniem.
System korzysta z danych z różnych czujników, takich jak wzrok i informacje zwrotne dotyczące siły, aby opracować pełne zrozumienie zadania. Na przykład dotyk jest istotny dla zadań takich jak odwracanie naleśników czy ucieranie ciasta, ponieważ znacznie zwiększa on sukces wykonania zadania.
Po zakończeniu początkowego etapu szkolenia, sieci neuronowe robotów kontynuują szkolenie przez noc, doskonaląc umiejętności nauczone podczas teleoperacji. Celem jest, aby robot opanował umiejętność w pełni, gdy badacze wrócą do laboratorium następnego dnia.
Ten postęp w nauce robotów jest znaczącym krokiem w kierunku tworzenia robotów, które mogą uczyć się i dostosowywać do nowych zadań w prawdziwym środowisku. Poprzez połączenie tradycyjnych technik nauki z modelami dyfuzji, TRI posuwa granice tego, czego roboty mogą osiągnąć, eliminując potrzebę długotrwałego szkolenia i umożliwiając szybsze zdobywanie umiejętności.
Źródła:
– TechCrunch Disrupt
– Toyota Research Institute