До роботів-універсальних помічників щонайменше десятиліття: що заважає індустрії
Ефектні відео з роботами, що танцюють, виконують трюки чи миють посуд, легко стають вірусними. Компаніям, що займаються робототехнікою, вигідно створювати враження, що механічний помічник от-от розумітиме ваші команди та допомагатиме з найрізноманітнішими завданнями. Однак на практиці у робототехніки ще багато проблем. Учені Карл Стратерн та Дмитра Гкація з відділу обчислювальної техніки Единбурзького університету Нейпіра розповіли для The Conversation про стан галузі та чого очікувати найближчим часом. SPEKA публікує адаптований переклад.
Занадто добре, щоб бути правдою: що стоїть за демонстраційними відео
Роботи Optimus, які вільно ходять, танцюють та розмовляють на нещодавній демонстрації Tesla викликали величезний ажіотаж, але захоплення обернулися розчаруванням, оскільки стало очевидно, що більша частина того, що відбувається, насправді контролюється дистанційно людьми.
(Наприклад, на одному з відео Optimus складає сорочку, але глядачі помітили, що рука постійно махає в поле зору камери. За кадром хтось виконував завдання, а робот імітував людину. Ця технологія називається телеоперацією і походить ще аж з 1940-х років — ред.).
На жаль, це не перший випадок, коли все виявляється занадто добрим, щоб бути правдою.
Візьмемо, наприклад, Софію, робота, створеного техаською компанією Hanson Robotics ще у 2016 році. Компанія представила її як розумну істоту, що спонукало багатьох технічних спеціалістів пояснювати, що це поза нашими можливостями на той час.
(У січні 2018 року директор зі штучного інтелекту Facebook Янн ЛеКун написав у Twitter, що Софія — «bullshit» й має таке ж відношення до справжнього самоусвідомленого штучного інтелекту, як картярські фокуси до магії — ред.).
Підписуйтеся на наші соцмережі
Подібним чином ми бачили ретельно хореографічне відео із заздалегідь розробленими сценаріями дій, як-от гімнастичні трюки робота Atlas від Boston Dynamics, робота Ameca англійського виробництва, який начебто «прокидається», хоча його емоції запрограмовані. Очевидно, що вони все ще вражають, але це далеко не розумний механізм. Поставте Optimus або Atlas у випадковий будинок (неконтрольоване середовище), і ви побачите щось зовсім інше.
Чому роботам важко працювати у різних середовищах
Гуманоїдний робот, здатний працювати в наших домівках, повинен бути здатним виконувати багато різносторонніх завдань. А крім цього використовувати інструменти людей, орієнтуватися в нашому середовищі та спілкуватися з нами, як людина. Якщо ви думали, що це буде лише через рік чи два, ви будете розчаровані.
Створення роботів, здатних взаємодіяти та виконувати складні завдання в наших будинках і на вулицях, все ще є величезною проблемою.
Насправді розробники вже створили робота, який відкриває різні двері, але до роботів, здатних виконувати сотні повсякденних завдань, ще далеко.
Дистанційне керування
Техніка дистанційного керування або телеоперації є широко використовуваним методом керування в робототехніці, що дає дослідникам орієнтир, на якому можна перевірити їхні реальні досягнення. Він існує вже деякий час і стає все більш досконалим. Наприклад, одна людина може одночасно керувати багатьма роботами-гуманоїдами напівавтономно, використовуючи заздалегідь прописані рухи, підказки для розмови та комп’ютеризовану мову.
Очевидно, що це дуже корисна технологія. Телеметричні системи використовуються для керування роботами, які працюють у небезпечних середовищах, для людей з обмеженими можливостями та навіть у відкритому космосі. Але причина, чому людина все ще керує, полягає в тому, що навіть найдосконаліші людиноподібні роботи, такі як Atlas, ще недостатньо надійні, щоб працювати повністю незалежно в реальному світі.
Інша серйозна проблема полягає в тому, що ми можемо назвати соціальним ШІ. Провідні генеративні програми штучного інтелекту, такі як Gemini від DeepMind і GPT-4 Vision від OpenAI, можуть стати основою для творчих автономних систем штучного інтелекту для роботів-гуманоїдів у майбутньому. Але це ще не означає, що тепер робот здатний добре функціонувати в реальному світі.
Інтерпретація інформації та розв'язання проблем, як людина, вимагає набагато більше, ніж просто розпізнавання слів, класифікації об’єктів і генерування мови. Це вимагає глибшого контекстуального розуміння людей, об’єктів і середовища – іншими словами, здорового глузду.
Як навчити роботів здоровому глузду
Щоб дослідити, що зараз можливо, ми нещодавно завершили дослідницький проект під назвою Common Sense Enhanced Language and Vision (CiViL). Ми оснастили робота на ім'я Евклід знаннями здорового глузду як частиною генеративного ШІ та мовної системи. Для цього нам довелося створити бази даних здорового глузду, використовуючи реальні приклади розв’язування проблем, створені студентами.
Евклід міг пояснити складні кроки в рецептах, дати поради, коли щось пішло не так, і навіть вказати людям місця на кухні, де зазвичай можна знайти посуд та інструменти. Але залишалися питання, наприклад, що робити, якщо у когось під час приготування їжі виникла сильна алергічна реакція. Проблема полягає в тому, що майже неможливо впоратися з усіма можливими сценаріями, але це те, що передбачає справжній здоровий глузд.
Цей фундаментальний аспект штучного інтелекту з роками дещо втратився в роботах-гуманоїдах. Згенероване мовлення, реалістичні вирази обличчя, телеметричне керування, навіть можливість грати в такі ігри, як «камінь, ножиці, папір», — усе це вражає. Але новизна незабаром зникає, якщо роботи фактично не здатні робити нічого корисного самостійно.
Іншою ключовою проблемою є відсутність реальних даних для систем штучного інтелекту, оскільки онлайн-дані не завжди точно відображають реальні умови, необхідні для достатнього навчання наших роботів. Нам ще належить знайти ефективний спосіб збору цих реальних даних у достатньо великих кількостях, щоб отримати хороші результати. Однак незабаром це може змінитися, якщо ми зможемо отримати до нього доступ із таких технологій, які використовуються у розумних окулярах.
Однак до розробки мультимодальних гуманоїдних роботів із передовим соціальним штучним інтелектом, здатних допомагати по дому, нам ще, мабуть, десятиліття. Можливо, тим часом нам запропонують роботів, керованих дистанційно з командного центру. Але чи захочемо ми їх?
Важливіше, щоб ми зосередили наші зусилля на створенні роботів для ролей, які можуть підтримувати людей, які зараз терміново потребують допомоги. Приклади включають охорону здоров’я, де існують довгі черги, а лікарням завжди бракує медсестер та доглядальниць; та освіта, щоб запропонувати дітям, які страждають від надмірної тривоги або важкохворим, брати участь у навчанні дистанційно. Нам також потрібна краща прозорість, законодавство та загальнодоступне тестування, щоб кожен міг відрізнити факти від вигадки, щоб зміцнити довіру суспільства до того моменту, коли роботи все-таки матимуть широке застосування.