Головна штучний інтелект

Що вміє GPT-4: головне зі стриму Грега Брокмана, співзасновника OpenAI

15 березня 2023 5 хвилин читання

Співзасновник і технічний директор OpenAI продемонстрував деякі можливості та обмеження нової моделі GPT-4 після її релізу. SPEKA проглянула презентацію та розповіла про головні зміни та концепти нейромережі.

Що вміє GPT-4: головне зі стриму Грега Брокмана, співзасновника OpenAI зображення 1

Як працює GPT-4

Чим GPT-4 відрізняється від ChatGPT

Ключова версія напередодні релізу полягала у тому, що GPT-4 працюватиме на основі мультимодальних моделей. Це означає, що в алгоритму є мультимодальний словник, у якому частина токенів відповідає за текст, а інші за зображення, звуки тощо.

Фактично GPT-4 може працювати у різних форматах, як-от текст, зображення та, ймовірно, відео та аудіо. Нагадаємо, що ChatGPT, як і мовна модель GPT 3,5, на основі якої він створений, працює лише з текстом.

На презентації Грег Брокман продемонстрував можливість використовувати як запит до GPT-4 не лише текст, а й зображення. Щоправда, зазначив, що це лише попередній перегляд і ця функція поки що недоступна для широкого загалу, а OpenAI ще працює над нею у співпраці з компанією Be My Eyes.

Також GPT-4 здатен розпізнавати, що є на зображеннях, робити докладні описи та добре аналізувати рукописні записи.

Що вміє GPT-4: головне зі стриму Грега Брокмана, співзасновника OpenAI зображення 2

GPT-4 розпізнає та описує скриншот із чату в Discorde

Підписуйтеся на наші соцмережі

Як покращили функціонал GPT-4

Нова версія має оновлені функції безпеки. OpenAI стверджує, що нейромережа на 82% рідше генерує заборонені відповіді і надає на 40% більше фактичних відповідей. Однак наразі важко сказати, що це означає на практиці.

Також у компанії розповіли, що працюють над оптимізацією моделі, щоб GPT-4 швидше генерував результати. До речі, він може опрацьовувати великі документи. Діалогове вікно дозволяє використовувати 32 тис. токенів (приблизно ж стільки символів). У ChatGPT ліміт становив 4 тис. токенів.

Робота з текстом у GPT-4

У звичайній розмові різниця між GPT-3.5 і GPT-4 може бути незначною, кажуть представники OpenAI у блозі. Різницю видно, коли складність завдання досягає певного порога — GPT-4 надійніший, креативніший і здатний обробляти набагато складніші інструкції, ніж GPT-3.5.

Як приклад Грег наводить самаризацію текстів. Зокрема, GPT-4 може вибирати поняття, які починаються з певної літери, та скласти за ними короткий конспект з тексту. Але набагато важливіше те, що ця модель здатна знаходити спільні теми або висновки з кількох окремих текстів.

Також показали вже відому функцію складати вірші та поеми на будь-яку тему, навіть щодо процесів, які GPT-4 виконував як завдання. Зокрема, він склав поему про підрахунок податків.

Що вміє GPT-4: головне зі стриму Грега Брокмана, співзасновника OpenAI зображення 3

Вірш про підрахунок податків (попереднє завдання GPT-4)

Нові можливості для кодування в ChatGPT-4

Директор OpenAI також показав, як за допомогою ChatGPT створив бота для Discord. ШІ-асистент пише псевдо- та реальний код. Тренувальні дані для GPT обмежувалися 2021 роком, тому він спершу створив бота, який б підходив для API Discord версії 2020-го. Та якщо додати йому свіжі відомості, він може запам'ятати та застосувати ці знання одразу й створити актуальний код. А якщо у коді є помилка, ви просто можете додати її у діалогове вікно навіть без прохання виправити. Також GPT-4 адаптовує код залежно від того, яке середовище розробки ви використовуєте.

При цьому вам взагалі не обов'язково писати код. Під час демонстрації Грег Брокман намалював у блокноті схему сайту та пропонований вміст, і нейромережа створила для нього робочий код у HTML та JavaScript, що дозволило запустити сайт на комп'ютері.

Схема сайту написана Грегом Брокманом у блокноті

Код для сайту згенерований GPT-4

Сайт створений після запуску коду

Виконання рутинних та складних завдань від OpenAI

Технічний директор OpenAI зазначає, що вони ще не знають усіх можливих способів застосування GPT-4, але впевнені, що він може спростити виконання складних та неприємних завдань. Як приклад він використав сплату податків.

Він завантажив алгоритму інструкцію на 16 сторінок із податкових визначень і попросив порахувати податки подружжя за 2018 рік, маючи дані про їхні доходи. При цьому модель врахувала інформацію з інструкції, зокрема правильно визначила стандартне відрахування та зміни в оподаткуванні, які ставали чинними з 2018 року.

Що вміє GPT-4: головне зі стриму Грега Брокмана, співзасновника OpenAI зображення 4

Розрахунок податкових відрахувань прорахований за допомогою GPT-4

За словами Грега Брокмана, він не зміг виконати це завдання з першого разу через об'ємну інструкцію та велику кількість чинників і витратив на нього пів години. Після цього він попросив GPT-4 розповісти по кроках його алгоритм дій.

На завершення презентації він окреслив своє бачення GPT-4: «Система не ідеальна, як і ми, але мені здається, що у цьому її суперсила. Це інструмент, що підсилює нас і допомагає досягати нових висот. Вона має сирі можливості, але вони дуже гнучкі. Їй байдуже, чи це код, чи текст, зображення, чи обрахунок податків. Усі ці можливості можна спрямувати на проблеми, які хвилюють саме вас».

Підписуйтеся на наші соцмережі

Інші матеріали

Чому вільний час все ще такий невловимий?

Сніжана Лепко 20 годин тому

За останнє століття продуктивність праці значно зросла. То чому ж люди все ще працюють так важко і так довго? Про це розповідає заслужений професор...

Чому вільний час все ще такий невловимий?

Як ефективно організувати свій час: метод тайм-менеджменту Pomodoro

Сніжана Лепко 5 годин тому

Хочете краще зосереджуватися на завданнях, забезпечуючи відновлювальні перерви в роботі та подолати схильність до прокрастинації та багатозада...

Як ефективно організувати свій час: метод тайм-менеджменту Pomodoro

Як дізнатися, чи відео, яке ви переглядаєте, створено за допомогою ШІ

Назар Стрільчук 22 години тому

Компанії штучного інтелекту в захваті від відеогенераторів. Вони стверджують, що демократизує процес створення та монтажу відео. Однак технологія, ...

Як дізнатися, чи відео, яке ви переглядаєте, створено за допомогою ШІ

Як працює технологія ВАР у футболі

Назар Стрільчук 22 хвилини тому

Футбол — дуже консервативний вид спорту. Основні правила гри не мінялися від її започаткування понад 160 років тому, а за всю історію серйозні ново...

Еволюція іграшок з Happy Meal

Олеся Руденко 19 годин тому

Спробуйте знайти дитину, яка не любить Happy Meal з McDonald's. Це виглядає майже неможливим. Маленький гамбургер, чизбургер або курячі нагетси, по...