DeepMind випустила модель RT-X, яка навчає роботів розвивати нові навички
Підрозділ компанії Google DeepMind представив загальну модель штучного інтелекту RT-X та набір даних Open X-Embodiment, які допомагають роботам розвивати нові навички.
Щоб створити набір даних та модель на основі досвіду, отриманого від 22 різних типів роботів, фахівці співпрацювали з 33 академічними лабораторіями по всьому світу.
Набір даних Open X-Embodiment містить широкий спектр демонстрацій роботів. Це дозволить RT-X:
- керувати різними роботами;
- дотримуватись різноманітних мовних інструкцій;
- виконувати основні міркування щодо складних завдань;
- узагальнювати дії.
Open X-Embodiment показує понад 500 навичок і 150 тис. завдань у більш ніж мільйоні епізодах. За даними розробників, це найповніший у своєму роді набір даних робототехніки.

RT-X розробили з використанням архітектури попередніх моделей DeepMind:
- RT-1 — модель для роботизованого управління в масштабі:
- RT-2 — модель «зір-мова-дія», яка вивчає інтернет та дані робототехніки.
Результати тестування моделі RT-X від DeepMind
DeepMind протестувала RT-X в сімох різних дослідницьких лабораторіях. Модель продемонструвала в середньому 50% покращення порівняно з іншими методами на п’яти різних роботах, які часто використовуються.
У порівнянні з RT-2 він втричі підвищив продуктивність щодо реальних робототехнічних навичок, зазначили розробники.

За словами DeepMind, Open X-Embodiment та RT-X наближають майбутнє, де моделі з кількома роботами можна буде навчити узагальнювати різні платформи, сцени, об’єкти та завдання.
Розробники відкрили доступ до моделі та набору даних, щоб прискорити дослідження в спільноті.
Раніше SPEKA писала про модель штучного інтелекту RT-2 від Google, яка допомагає роботам розуміти такі завдання, як викидання сміття.