Штучний інтелект 2024: ключові тренди та прогнози
2024 рік став черговим етапом для індустрії штучного інтелекту. Кельвін Му директор фонду Translink Capital та інвестор, що спеціалізується на ШІ-стартапах систематизував свої спостереження за галуззю у звіті «2024 Backward Pass: The Definitive Guide to AI in 2024». SPEKA виділила головне зі звіту. Зокрема, чи продовжаться інвестиції в ШІ, монетизацію компаній, проблему браку даних та інше.
Інфраструктурний Рівень: Третя революція в технологіях
На думку, Кельвіна Му, Ми є свідками появи нової інфраструктурної парадигми. До цього в сучасній історії лише двічі виникала раніше абсолютно нова інфраструктура та обчислювальна технологія — це бум інтернету та телекомунікацій наприкінці 20-го століття та поява хмарних обчислень. Зараз із генеративним штучним інтелектом ми вступаємо в третій етап.
Хоча аж $300 млрд було інвестовано в інфраструктуру ШІ за останні два роки, це лише початок. Інвестор порівнює вкладення з епохою розбудови мережі Інтернет. Адже у неї в період між 1996 і 2001 роками вклали понад 1 трлн доларів!
Витрати зростають усюди, оскільки будь-який ШІ стартап потребує великих фізичних потужностей для проведення обчислень та навчання своїх алгоритмів. Ці компанії стикаються зі значними вимогами до капіталу не лише через чипи, а також для будівництва центрів обробки даних.
Компанія Nvidia, як виробник чипів найбільше виграла від цієї трансформації. Зокрема через ріст акцій стала найдорожчою компанією у світі, збільшивши свою ринкову капіталізацію в десять разів до 3 трильйонів доларів протягом 2 років.
Зростає кількість стартапів, які розробляють спеціальні мікросхеми ASIC для робочих навантажень ШІ (наприклад, Grok, Cerebras). Серед стартапів поки що Cerebras, здається, попереду з $136 млн доходу в першому півріччі 2024 року, але це все ще лише 0,1% доходу центру обробки даних Nvidia.
Звісно такий розвиток впливає і на споживання електроенергії — вже зараз дата-центри складають приблизно 1-2% світового, але прогнозується, що до 2030 року ця цифра зросте до 3-4% від загальної потужності, в основному через ШІ (у США цей показник може сягнути і 8%). Тому очікується зростання спеціалізованих дата-центрів та оптимізація енергоспоживання через інновації, такі як рідинне охолодження.
Малі мовні моделі — великі зміни
Підписуйтеся на наші соцмережі
Серед основних інновацій 2024 року – це успіх малих мовних моделей (SLM), які значно підвищили ефективність і дозволяють запускати моделі на пристроях з обмеженими ресурсами, як ноутбуки чи смартфони. Наприклад, модель на 3 млрд параметрів може відповідати продуктивності оригінальної моделі GPT-3 з 175 млрд параметрів.
Машинне навчання переходить до більш складних архітектур, де використовуються не великі монолітні моделі, а мережі спеціалізованих, менш об'ємних моделей, які працюють у синергії. Такий підхід є більш ефективним і наближається до того, як функціонує людський мозок.
Однак попри ці досягнення, конкуренція серед провідних гравців, таких як OpenAI та Meta, посилюється. Деякі компанії, наприклад, Anthropic, активно працюють над поліпшенням своїх моделей, наближаючи їх до рівня OpenAI.
Серед початкових засновників залишилися лише Грег Брокман і Войцех Заремба, але ключові спеціалісти такі як Ілля Суцкевер, Джон Шульман і Міра Мураті пішли. Та попри це OpenAI зібрав $6,5 млрд під час останнього раунду фінансування та оцінюється у $150 млрд і наразі є найшвидше зростаючою технологічною компанією в історії, значно випереджаючи Amazon, Google і Meta.
Роль синтетичних даних та копірайт
Коли у нас закінчаться загальнодоступні навчальні дані, синтетичні дані будуть грати більш помітну роль. Синтетичні дані все частіше використовуються як до, так і після навчання моделі. Водночас перетин штучного інтелекту та закону про авторське право стає критичною проблемою для контенту генеративного ШІ.
Відбуваються суперечки про те, що Apple, Nvidia та Anthropic використовувала відео YouTube без дозволу для навчання моделей штучного інтелекту, шо веде до проблеми з порушенням прав інтелектуальної власності. Так само великі звукозаписні компанії, такі як Universal, Sony і Warner подають до суду на стартапи зі штучним інтелектом, такі як Suno та Udio, за використання захищеної авторським правом музики для створення контенту.
Водночас деякі компанії працюють над вирішенням цієї проблеми та бачать у цьому потенційний ринок. Цікавим стартапом є Tollbit. Він TollBit дозволяє видавцям монетизувати свій контент і надає розробникам ШІ етичний доступ до даних.
Ще один ProRata.ai працює над цим технологією, яка надаватиме справедливу винагороду власникам контенту.
Монетизація, виклики ринку та подальші інвестиції
У 2024 році основним інструментом в ШІ стала технологія Retrieval-Augmented Generation (RAG), яка дозволяє інтегрувати реальні дані в процес генерування тексту. Варіанти використання включають надання доступу чат-бота до внутрішніх даних компанії або надання фактичної інформації лише з авторитетного джерела. Проте ця технологія постає перед труднощами, такими як недостатній контекст або неточність при видобуванні даних.
Впродовж 2024 р. різко зросли витрати на генеративні ШІ-застосунки. Прогнозується, що до кінця року витрати складуть $4,6 млрд, що в 8 разів більше порівняно з 2023 роком. Одна з головних сфер застосування – це генерація коду, чат-боти для підтримки клієнтів та покращення пошуку.
Разом із тим використання ШІ у “реальному” фізичному світі, досі рухається повільно.
Наприклад, попри високий потенціал, штучний інтелект в робототехніці має дуже обмежену кількість даних для навчання моделей, а тому поки що недостатньо ефективний.
Попри певний скептицизм та неоднозначні результати інвестиції в ШІ продовжують зростати. З початку року інвестиції в штучний інтелект перевищили 60 млрд дол., що більше ніж третина усього венчурного фінансування.
Штучний інтелект продовжує змінювати глобальну економіку, що також породжує нові питання щодо регулювання та відповідальності, адже ШІ-технології розвиваються швидше, ніж законодавчі ініціативи.