Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

OpenAI випускає нову модель, здатну міркувати та зі знаннями рівня PhD: що відомо про o1-preview та o1-mini

Олександр Тартачний
Олександр Тартачний журналіст
13 вересня 2024 6 хвилин читання

OpenAI випускає нову модель під назвою o1, першу в запланованій серії моделей штучного інтелекту здатних, до міркування» та ланцюжкового мислення. Ця серія відзначається покращеними здібностями до міркування та вирішення складних завдань у галузях природничих наук, програмування і математики та розв’язує проблеми на рівні здібного випускника аспірантури. Розповідаємо, кому знадобиться o1, у чому відмінність від попередніх версій, які має недоліки та переваги. 

Нові версії штучного інтелекту від OpenAI — o1-preview і o1-mini: переваги та недоліки Нові версії штучного інтелекту від OpenAI — o1-preview і o1-mini: переваги та недоліки

Нові моделі o1-preview та o1-mini від OpenAI: що це та як їх використовувати

OpenAI навчав попередні моделі GPT імітувати шаблони зі своїх навчальних даних. Натомість o1 навчали самостійно розв'язувати проблеми за допомогою техніки, відомої як навчання з підкріпленням, яка навчає систему за допомогою винагород і покарань. Вона використовує «ланцюг думок» для оброблення запитів, подібно до того, як люди обробляють проблеми, розглядаючи їх крок за кроком.

Cхема роботи моделі штучного інтелекту o1 від OpenAI Cхема роботи моделі штучного інтелекту o1 від OpenAI

Версії o1-preview та o1-mini працюють подібно до докторів наук у складних контрольних завданнях з фізики, хімії та біології. Система також чудово вирішує завдання з математики та програмування.

«Модель, безумовно, розв’язує тест з математики краще, ніж я, а я вивчав математику в коледжі», — каже головний науковий співробітник OpenAI Боб МакГрю. 

До прикладу, на відбірковому іспиті до Міжнародної олімпіади з математики GPT-4o (попередня версія) правильно розв’язав лише 13% задач, тоді як модель міркування набрала 83%. Здібності до кодування оцінювали на змаганнях і досягли 89% процентиля на змаганнях Codeforces (саме версія o1-mini призначена для програмування). 

Підписуйтеся на наші соцмережі

Точність відповідей у різних галузях порівняння GPT4o та o1 Точність відповідей у різних галузях порівняння GPT4o та o1

Чим відрізняється o1-preview та o1-mini від версій GPT

Наразі версії o1, зокрема o1-preview та o1-mini, доступні у пробній версії. У компанії зазначають, що o1 поки що не має певних переваг GPT-4o. Ці моделі штучного інтелекту не генерують відповідь одразу, а розбивають задачу на фрагменти та перевіряють самі себе, а тому відповідь доведеться очікувати дещо довше. Також вони ще не мають багатьох функцій, які роблять ChatGPT корисним, як-от пошук інформації в інтернеті та завантаження файлів і зображень.

Користувачі Reddit, які вже перевірили деякі можливості нових версій, також зауважують, що ця модель не надто добра для перекладу з однієї мови на іншу. Переклад гірший за GPT-4o і не надто креативний. Він простий і мало піклується про контекст.

«Але для складних завдань міркування це значний прогрес і пропонує новий рівень можливостей ШІ. Враховуючи це, ми повертаємо лічильник до 1 і називаємо цю серію OpenAI o1», — кажуть у релізі компанії.

Оскільки це попередній перегляд, то варто також очікувати оновлень та покращень, які розробляються вже зараз. 

Для кого корисним буде o1 від OpenAI та скільки він коштує

Ці розширені можливості міркування можуть бути особливо корисними, якщо ви розв'язуєте складні завдання у науці, кодуванні, математиці тощо. Тобто це корисний інструмент для дипломних робіт, дисертацій, досліджень, маркетингових стратегій, розрахунків тощо. Він не надто практичний для швидких повсякденних завдань. Не лише через тривалий час відповіді, а й через вартість та ліміти. 

Користувачі ChatGPT Plus (платна версія за $20/міс.) і Team (корпоративне рішення для команди) мають тижневе обмеження на 30 повідомлень для o1-preview та 50 для o1-mini. 

Користувачі ChatGPT Enterprise та Edu отримають доступ до обох моделей з наступного тижня. 

Щодо розробників, які використовують API, то вони наразі мають обмеження до 20 запитів на хвилину. O1-preview має високу ціну в API — $15 за 1 млн вхідних токенів (токен приблизно дорівнює слову) і $60 за 1 млн токенів, що значно дорожче, ніж GPT-4o. Для порівняння, GPT-4o коштує $5 за 1 млн вхідних токенів і $15 за 1 млн вихідних.

Також у компанії заявили, що планують надати доступ o1-mini для всіх користувачів безкоштовної версії ChatGPT.

Є також деякі офіційні рекомендації, як краще використовувати цей інструмент. Серед них: 

  • Робіть запити простими та прямолінійними: модель o1 чудово розуміє та відповідає на короткі, чіткі інструкції без потреби у великих поясненнях.
  • Уникайте промптів з ланцюжком міркувань (йдеться про Chain Of thoughts і «думай крок за кроком»): оскільки модель виконує логічні висновки в собі, не потрібно спонукати її «думати крок за кроком» або «пояснювати свою думку вголос».
  • Використовуйте розділювачі для ясності: використовуйте роздільники, як-от потрійні лапки ```, XML-теги або заголовки розділів, щоб чітко позначити різні частини введення, допомагаючи моделі правильно інтерпретувати різні секції.

Чому моделі штучного інтелекту, які міркують, — це великий прорив

Великі мовні моделі не такі розумні, як багато хто вважає. По суті, вони просто передбачають послідовності слів, щоб отримати відповідь на основі шаблонів, отриманих із величезної кількості даних. Наприклад, ChatGPT на основі мовних моделей часто помиляється, коли його просять визначити, скільки разів трапляється літера “r” у слові strawberry. Все тому, що попри «мовність» у назві для попередніх моделей, це слово існує як токен — послідовність певних цифр.  

Для дослідників штучного інтелекту міркувань є важливим наступним кроком до інтелекту на рівні людини. Вважається, що якщо модель здатна не тільки розпізнавати образи, вона може відкрити прорив у таких сферах, як медицина та інженерія. Наразі здатність міркування від o1 досі є дискусійною (щоправда, навіть людям важко визначити, що вони вкладають у це поняття), відносно повільною та дорогою. 

Водночас OpenAI прагне залучити більше фінансування, а воно напряму залежить від нових наукових проривів. Компанія надає можливості міркування для LLM, оскільки бачить майбутнє за автономними системами або агентами, які здатні ухвалювати рішення та виконувати дії від вашого імені.

Підписуйтеся на наші соцмережі

50 UAH 150 UAH 500 UAH 1000 UAH 3000 UAH 5000 UAH
0
Прокоментувати
Інші матеріали

Стартапи тижня: від AI до підводного охолодження — огляд найцікавіших історій

Вікторія Рудзінська 18 годин тому

Співрозробник Sora в OpenAI Тім Брукс переходить до Google DeepMind

Павло Бартос 4 жовтня 2024 18:46

iPhone SE 4: що очікувати від майбутнього доступного смартфону Apple

Павло Бартос 4 жовтня 2024 17:21

Google випустив нову функцію для пошуку – за допомогою відео

Павло Бартос 4 жовтня 2024 15:32

Фонд «Повернись живим» отримав ШІ-помічника від IT-Enterprise

Вікторія Рудзінська 4 жовтня 2024 07:11