Що вміє GPT-4: головне зі стриму Грега Брокмана, співзасновника OpenAI
Співзасновник і технічний директор OpenAI продемонстрував деякі можливості та обмеження нової моделі GPT-4 після її релізу. SPEKA проглянула презентацію та розповіла про головні зміни та концепти нейромережі.
Чим GPT-4 відрізняється від ChatGPT
Ключова версія напередодні релізу полягала у тому, що GPT-4 працюватиме на основі мультимодальних моделей. Це означає, що в алгоритму є мультимодальний словник, у якому частина токенів відповідає за текст, а інші за зображення, звуки тощо.
Фактично GPT-4 може працювати у різних форматах, як-от текст, зображення та, ймовірно, відео та аудіо. Нагадаємо, що ChatGPT, як і мовна модель GPT 3,5, на основі якої він створений, працює лише з текстом.
Також GPT-4 здатен розпізнавати, що є на зображеннях, робити докладні описи та добре аналізувати рукописні записи.
Підписуйтеся на наші соцмережі
Як покращили функціонал GPT-4
Нова версія має оновлені функції безпеки. OpenAI стверджує, що нейромережа на 82% рідше генерує заборонені відповіді і надає на 40% більше фактичних відповідей. Однак наразі важко сказати, що це означає на практиці.
Також у компанії розповіли, що працюють над оптимізацією моделі, щоб GPT-4 швидше генерував результати. До речі, він може опрацьовувати великі документи. Діалогове вікно дозволяє використовувати 32 тис. токенів (приблизно ж стільки символів). У ChatGPT ліміт становив 4 тис. токенів.
Робота з текстом у GPT-4
У звичайній розмові різниця між GPT-3.5 і GPT-4 може бути незначною, кажуть представники OpenAI у блозі. Різницю видно, коли складність завдання досягає певного порога — GPT-4 надійніший, креативніший і здатний обробляти набагато складніші інструкції, ніж GPT-3.5.
Як приклад Грег наводить самаризацію текстів. Зокрема, GPT-4 може вибирати поняття, які починаються з певної літери, та скласти за ними короткий конспект з тексту. Але набагато важливіше те, що ця модель здатна знаходити спільні теми або висновки з кількох окремих текстів.
Також показали вже відому функцію складати вірші та поеми на будь-яку тему, навіть щодо процесів, які GPT-4 виконував як завдання. Зокрема, він склав поему про підрахунок податків.
Нові можливості для кодування в ChatGPT-4
Директор OpenAI також показав, як за допомогою ChatGPT створив бота для Discord. ШІ-асистент пише псевдо- та реальний код. Тренувальні дані для GPT обмежувалися 2021 роком, тому він спершу створив бота, який б підходив для API Discord версії 2020-го. Та якщо додати йому свіжі відомості, він може запам'ятати та застосувати ці знання одразу й створити актуальний код. А якщо у коді є помилка, ви просто можете додати її у діалогове вікно навіть без прохання виправити. Також GPT-4 адаптовує код залежно від того, яке середовище розробки ви використовуєте.
При цьому вам взагалі не обов'язково писати код. Під час демонстрації Грег Брокман намалював у блокноті схему сайту та пропонований вміст, і нейромережа створила для нього робочий код у HTML та JavaScript, що дозволило запустити сайт на комп'ютері.
Виконання рутинних та складних завдань від OpenAI
Технічний директор OpenAI зазначає, що вони ще не знають усіх можливих способів застосування GPT-4, але впевнені, що він може спростити виконання складних та неприємних завдань. Як приклад він використав сплату податків.
Він завантажив алгоритму інструкцію на 16 сторінок із податкових визначень і попросив порахувати податки подружжя за 2018 рік, маючи дані про їхні доходи. При цьому модель врахувала інформацію з інструкції, зокрема правильно визначила стандартне відрахування та зміни в оподаткуванні, які ставали чинними з 2018 року.
За словами Грега Брокмана, він не зміг виконати це завдання з першого разу через об'ємну інструкцію та велику кількість чинників і витратив на нього пів години. Після цього він попросив GPT-4 розповісти по кроках його алгоритм дій.
На завершення презентації він окреслив своє бачення GPT-4: «Система не ідеальна, як і ми, але мені здається, що у цьому її суперсила. Це інструмент, що підсилює нас і допомагає досягати нових висот. Вона має сирі можливості, але вони дуже гнучкі. Їй байдуже, чи це код, чи текст, зображення, чи обрахунок податків. Усі ці можливості можна спрямувати на проблеми, які хвилюють саме вас».