Штучний інтелект і машинне навчання: що відбувається на ринку і які перспективи галузі
Крім впливу на попкультуру та апокаліптичні прогнози повстання машин, штучний інтелект (ШІ) та машинне навчання (МН) посідають істотне місце у світі венчурних інвестицій.
У березні 2023 року Білл Гейтс назвав штучний інтелект революційною розробкою, що стане в один ряд із персональними комп'ютерами, смартфонами та навіть інтернетом. Його заява викликана насамперед успіхом генеративного ШІ. Нині про цю тему кричать звідусіль, тому без значної сили волі ігнорувати її не виходить. Однак для сфери венчурних інвестицій штучний інтелект і машинне навчання не є чимось новим.
Сьогодні штучний інтелект і машинне навчання — одні з лідерів уваги венчурних інвесторів, які всіма силами намагаються надолужити згаяне. А ще ця тема комплексна і виходить далеко за рамки бізнесу. Стенфордському університетові, наприклад, для розкриття теми ШІ знадобилося 400 сторінок. Ми зі свого боку хочемо зробити акцент на венчурній складовій. Ця стаття допоможе увійти в курс справи з нуля, а також отримати ключову і, що важливо, актуальну інформацію про цю динамічну галузь.
Що таке ШІ та МН і в чому різниця?
Насправді ШІ та МН — не новітні технології. Їх винайшли ще у 1951 та 1952 роках. Але досі мало хто знає, що це за поняття та яка між ними різниця.
Штучний інтелект — це здатність комп'ютера виконувати завдання, для яких зазвичай потрібен людський інтелект. Наприклад, навчати (Elsa, застосунок для тренування вимови), розв'язувати задачі (Jasper, копірайтер зі штучним інтелектом), ухвалювати рішення (AlphaGo, ігровий інструмент) чи виявляти закономірності (DeepText, система пошуку та аналізу контенту у соцмережах).
Термін «машинне навчання» говорить сам за себе. Це метод програмування, який допомагає комп'ютерам самостійно навчатися та робити прогнози на основі даних. Зазвичай розробники пишуть код, який вказує комп'ютеру, як виконати певне завдання. А завдяки МН комп'ютер може навчитися помічати певні взаємозв'язки та алгоритми, і врешті самостійно виявляти закономірності. Найпопулярніші приклади таких систем — Watson, PyTorch, Apache Mahout та Open NN.
Ось простий приклад, який допоможе краще зрозуміти різницю. Уявімо, що нам необхідно створити систему, яка вміє розрізняти зображення котів і собак. Використовуючи ШІ, можна запрограмувати набір правил, які допоможуть комп'ютеру це зробити. Для цього доведеться чітко визначити, як виглядає кіт чи собака, щоб комп'ютер точно дотримувався певних правил. Саме машинне навчання допоможе нам впоратися з цією задачею.
Потрібно дати комп'ютеру великий набір даних із зображеннями котів і собак, щоб він самостійно вивчив закономірності та особливості, які відрізняють тварин. Це дозволить системі аналізувати зображення, які вона не бачила раніше, і постійно покращувати свій результат. Таку здатність до самовдосконалення можна вважати ознакою незалежного інтелекту.
Концепція штучного інтелекту передбачає ідею створення машини, яка може імітувати людський інтелект. Водночас машинне навчання — це конкретний інструмент, який використовують для досягнення штучного інтелекту.
Зараз штучний інтелект і машинне навчання використовуються майже в усіх сферах життя, включаючи охорону здоров'я, фінанси, транспорт і виробництво. Зазвичай вони допомагають автоматизувати процеси, зменшити кількість помилок і підвищити ефективність — ці технології дійсно можуть змінити наші життя. За прогнозами, показники економічної продуктивності у 16 галузях 12 найбільш розвинених країн світу можуть покращитися на 38% до 2035 року та сприятимуть економічному зростанню на 14 трильйонів доларів.
Огляд ринку
Сьогодні сектор ШІ & МН супроводжує підвищена увага, проте навіть без цього сплеску індустрія ніколи не була аутсайдером. Інвестиції в стартапи стабільно зростають з року в рік навіть без урахування божевілля щодо генеративного ШІ.
За даними CB Insights, 2022 року інвестори уклали 2956 угод на $45,8 млрд. Це на 34% менше YoY, але вище за всі попередні роки. Середній розмір угоди склав $20,7 млн. Ключова географія — США, які забрали собі більшу частину угод і грошей. 66% усіх інвестицій пішли стартапам на ранніх стадіях.
Аналітики з PitchBook підготували аналогічний огляд. За їхньою інформацією, 2022 року інвестори уклали 6727 угод на $78 млрд. Найбільше постраждали сегменти автономних транспортних засобів, розроблення процесорів, платформ автоматизації та інтелектуальних датчиків. Відзначається падіння інтересу до hardware. А ось споживчий сегмент, зокрема й генеративний ШІ, знаходиться на підйомі.
У нещодавньому масивному дослідженні Стенфордського університету повідомляється, що за результатами 2022 року глобальні приватні інвестиції в ШІ становили $91,9 млрд. Порівняно з 2013 роком приплив капіталу зріс у 13 разів.
Попри розбіжність деяких цифр, усі джерела підтверджують позитивну тенденцію інвестування в сектор. Цей фактор сприятливо позначиться на майбутньому індустрії, навіть після закінчення хайпу. Якщо говорити про глобальний розмір ринку, він становить близько $200 млрд, передає Grand View Research. Ба більше, з 2023 по 2030 прогнозується зростання на 37,3% щорічно.
Підписуйтеся на наші соцмережі
Окремо торкнемося слона в кімнаті — генеративного ШІ. PitchBook оцінює поточний розмір ринку цього напрямку в $42,6 млрд і прогнозує його зростання до $98 млрд у 2026. Лише за перший квартал 2023 року інвестиції у цій сфері збільшилися втричі, досягнувши $2,3 млрд, повідомляє Axios Pro.
Проте окремі оглядачі налаштовані скептично до новинки, відзначаючи деякі риси фінансової бульбашки. Генеративний ШІ може спіткати та сама доля, що й Web3 з криптовалютами.
На ринку вкрай мало проєктів для інвестицій, що змушує кидати гроші куди завгодно. Наприклад, за даними CB Insights, у 2022 році зареєстрували лише 110 угод, зате на $2,5 млрд. Така активність зрештою призведе до роздутих оцінок компаній і присутності на ринку нежиттєздатних проєктів.
Так чи інакше генеративний ШІ став справжнім локомотивом цілої індустрії. Через цього монстра у 2023 році світові витрати на системи з ШІ зростуть до рекордних $154 млрд, передає IDC. Усі хочуть собі нову іграшку.
Тенденції в індустрії. Що слід знати насамперед?
Під час написання цього блоку ми відштовхувалися від дослідження Стенфордського університету, яке без перебільшень можна назвати одним із найактуальніших документів, присвячених ШІ.
По-перше, абсолютна більшість ШІ-стартапів знаходиться в США. Для індустрії Штати — ключова географія, яка утримує впевнене лідерство вже не перший рік як з точки зору капіталу, так і кількості угод. Північна Америка обганяє конкурентів з різних причин. У Китаї, наприклад, існують труднощі з точки зору регуляторів і законодавства. Останнім часом китайський сектор ШІ практично заморожений. У Європі причина криється в іншому — нестача інфраструктури (детальніше про це тут і тут).
Продовжує зростати кількість компаній, які адаптують ШІ для власних потреб. Глобальне дослідження показало, що у 2022 близько 50-60% бізнесу так чи інакше почали використовувати ШІ. У 2017 році, наприклад, таких компаній було лише 20%. Цікаво, що робиться це не заради трендів. Бізнес підтверджує, що впровадження ШІ призвело до зменшення витрат і зростання доходу.
Що стосується кейсів, то найчастіше бізнес використовує ШІ для оптимізації сервісних операцій; створення нових продуктів на основі штучного інтелекту; сегментації клієнтів; аналітики обслуговування клієнтів; удосконалення продуктів, або іншими словами інтеграції в них ШІ.
Тепер переходимо до стартапів. Найбільше інвестицій залучають компанії, які розробляють ШІ-рішення для медицини та охорони здоров'я; хмарні рішення, оброблення та управління даними; фінтех; кібербезпека і захист даних загалом; роздрібна торгівля.
Найменше капіталу вкладають у сфери розпізнавання облич; Ed Tech; фітнес і wellness; Geospatial; Legal Tech; EntertШІnment; Agritech.
Коли ми говоримо про тренди в ШІ, важливо пам'ятати, що сам по собі ШІ в більшості випадків не є повноцінним продуктом. Скоріше це доповнення, яке значно впливає на бізнес і навіть змінює правила гри. У кожній індустрії ШІ використовується по-різному, враховуючи специфіку завдань та інші вимоги.
Наприклад, у Biotech штучний інтелект і машинне навчання можуть допомогти у відкритті ліків або пошуку нових типів білків. Тому про ШІ доречно говорити в розрізі конкретного контексту, тобто індустрії.
Тенденції в індустрії. Що пишуть в медіа?
Ми проаналізували популярні публікації у медіа за 2023 рік і відібрали найбільш згадувані прогнози. Серед джерел TechTarget, Fireflies, Emeritus і Dataversity.
- Автоматизоване машинне навчання (AutoМН), а саме поліпшені інструменти для маркування даних і автоматичного налаштування архітектур нейронних мереж.
-
Концептуальний дизайн. Впровадження ШІ у творчі індустрії в промислових масштабах. Наприклад, якщо дати ШІ текст "крісло авокадо", то він спроєктує крісло у формі авокадо.
-
Мультимодальне навчання. Це здатність ШІ аналізувати відразу кілька видів даних. Наприклад, текст, зір, мову і датчики IoT.
-
Моделі, які можуть досягати кількох цілей. Не плутати з попереднім пунктом. У цьому разі ШІ аналізує один або кілька видів даних, але для видачі результатів враховує відразу декілька поставлених цілей. Наприклад, зростання прибутку плюс дотримання екологічних норм. Зрештою ми отримуємо оптимальне рішення.
-
Кібербезпека. Нові методи ШІ та машинного навчання відіграватимуть дедалі більшу роль у виявленні та реагуванні на кіберзагрози.
-
Покращене мовне моделювання. Прогнозується, що з розповсюдженням генеративного ШІ зростатиме кількість неточностей, фейкової та навіть небезпечної інформації. Це змусить приділяти більше часу поліпшенню технології.
-
Комп'ютерний зір. Очікується здешевлення камер і ШІ, які призведуть до бурхливого розвитку комп'ютерного зору для аналітики та автоматизації вже цього року.
-
Демократизація ШІ. Удосконалення інструментарію знижує рівень знань, необхідних для створення моделей ШІ. Це полегшить залучення профільних експертів до процесу їх розробки.
-
Усунення похибок у МН. Мета полягає в тому, щоб ШІ робив прогнози об'єктивно. Наприклад, зараз люди можуть піддаватися дискримінації під час оформлення кредитів, купівлі товарів онлайн або отримання медичної допомоги.
-
Цифрові двійники. Їхні можливості дають змогу по-новому використовувати та прогнозувати дані. Наприклад, моделювання процесу захворювань, тестування нових ліків, поведінку клієнтів та економічні наслідки від ухвалення тих чи інших рішень.
-
Генеративний ШІ. Ну, тут усе зрозуміло. Зазначається, що технологія дала змогу ШІ перетворитися на інструмент для творчості й не тільки. Наприклад, технологію можна застосовувати для створення синтетичних даних.
-
Співпраця людини та штучного інтелекту стає нормою. Від написання коду, тестування, розгортання та виправлення помилок до створення контенту й автоматизації рутинних завдань. За даними Gartner, до 2030 року 80% співробітників будуть щодня взаємодіяти з інтелектуальними інструментами ШІ, тоді як сьогодні їх менше ніж 10%.
-
Розвиток розмовного ШІ. Ці тенденції охоплюють персоналізацію взаємодії, використання no-code для зниження навантаження на IT, а також включення обробки природної мови, машинного навчання та аналізу настроїв для розуміння намірів користувача.
-
Етика. Для навчання ШІ потрібні дані, і часто це означає персональні дані. Якщо люди не довіряють ШІ або не розуміють, як він ухвалює рішення, вони намагатимуться ділитися якомога меншою кількістю інформації про себе.
-
Квантові обчислення. У міру збільшення обсягу згенерованих і збережених даних зростає і потреба в потужніших і ефективніших обчислювальних технологіях. Квантові обчислення потенційно можуть реформувати безліч галузей, включно з фінансами, охороною здоров'я, роздрібною торгівлею та логістикою.
-
Low-Code & No-Code ШІ. Більш активне залучення нетехнічного персоналу у світ ШІ призведе до демократизації його використання в галузях і на підприємствах будь-якого розміру.
-
Розширена аналітика. Дозволяє ШІ досліджувати, допомагати в підготовці даних і генеруванні ідей шляхом застосування методів МН і обробки природної мови (NLP).
-
Edge ШІ. Це наступний рубіж обчислювальних технологій, який дасть змогу децентралізувати весь процес аналізу даних. Якщо коротко, джерела даних оснащуються інфраструктурою, необхідною для обробки даних у режимі реального часу.
-
Збільшення використання хмарних сервісів. Завдяки розвитку хмарного програмного забезпечення на базі ШІ та машинного навчання, бізнес може відстежувати й аналізувати корпоративні дані у режимі реального часу та вносити необхідні корективи у свої бізнес-процеси.
-
Бізнес-аналітика (BI). Використовуючи передові інструменти штучного інтелекту і МН, сучасні BI-платформи здатні краще визначати кореляції, тенденції й закономірності.
-
Зростання практики "дані як послуга", або DaaS. Дедалі частіше дані генеруватимуться спеціально для продажу зацікавленим особам.
У центрі уваги — генеративний ШІ
30 листопада 2022 року компанія Open ШІ представила ChatGPT — нову версію своєї мовної моделі, що використовує генеративний ШІ. Це досягнення викликало неабиякий інтерес до штучного інтелекту. ChatGPT став застосунком, який найшвидше набрав 100 мільйонів користувачів, випередивши TikTok, Instagram, Pinterest і Spotify. То чому ж генеративний ШІ такий популярний і за що його люблять користувачі?
Генеративний штучний інтелект навчається на великих обсягах даних і генерує новий контент різних форматів, як-от аудіо, код, зображення, текст, відео. Тому завдяки ньому можна швидко створювати будь-який цифровий контент, докладаючи значно менше зусиль.
Створення моделі генеративного ШІ — складне завдання. І поки лише декілька технологічних гігантів можуть із цим впоратися. Так, компанія OpenШІ, що розробила ChatGPT, а також попередні моделі GPT і DALL-E, отримала на розвиток власних проєктів мільярди доларів від відомих донорів. Google і Microsoft змагаються за кращу пошукову систему, розвиваючи Bard і Bing, що працюють за схожим принципом. DeepMind (дочірня компанія Google) і Meta запустили власні проєкти для генерації відео, які теж використовують Generative ШІ. Ці компанії наймають кращих у світі інженерів та науковців, які допомагають їм розробляти подібні продукти.
Однак, річ не лише в талантах. Тренувати моделі з використанням даних майже всього інтернету — дорого. Хоча OpenШІ не розкриває точних цифр, але за приблизними підрахунками для тренування GPT-3 знадобилося 45 терабайтів текстових даних. Можлива вартість таких розробок вимірюється мільйонами доларів. Очевидно, що пересічному стартапу такі ресурси недоступні.
Генеративний ШІ має необмежений потенціал та дозволяє створювати досить якісний контент за лічені секунди. До того ж рівень якості цього контенту з часом тільки зростатиме. Звісно, це напряму впливає на безліч індустрій, зокрема ІТ. Адже компанії, що займаються розробкою програмного забезпечення, зможуть миттєво отримувати високоякісний код, а рекламні агенції — ефективні маркетингові тексти.
Зрештою, будь-яка організація, якій потрібні тексти, ілюстрації чи інший контент, може скористатися технологією. Це відкриває нові горизонти для бізнесу, бо підприємці матимуть можливість витрачати менше часу і ресурсів на великий перелік задач завдяки ШІ.
Головні виклики для бізнесу
Стартапи, як і їхні клієнти, стурбовані низкою чинників, що заважають поширенню ШІ. За даними Стенфордського дослідження респонденти насамперед занепокоєні управлінням ризиками, пов'язаними з ШІ (50%). Це безпосередньо стосується теми регулювання, адже в майбутньому ШІ, безсумнівно, зазнає тих чи інших обмежень. А тому невідомо, що можна впроваджувати, а що ні. Болючою темою залишається пошук даних, потрібних для тренування моделей ШІ (44%). Як правило, даних або не вистачає, або вистачає, але вже скоро вони скінчаться.
37% бізнесу все ще шукає докази цінності ШІ, а 33% не можуть вибрати правильний продукт і технологію. У 42% спостерігаються проблеми з впровадженням ШІ.
Поради для інвесторів
Хоча інтерес до ШІ-бізнесу зростає, реальна кількість компаній, які вже залучили ШІ/МН-технології у роботу, менша за ту, яка просто вживає термін «Artificial intelligence» заради маркетингу.
Насамперед інвесторам слід ретельно проводити інвестиційний due diligence, щоб з'ясувати, чи дійсно компанія використовує штучний інтелект. За статистикою, 40% з 2830 європейських компаній, які стверджують, що впровадили ШІ, насправді не використовують цю технологію.
Часто інвестори просто слідують за трендом без жодних раціональних обґрунтувань. Наприклад, на початку 2023 року інвестори вкладалися у маловідомі публічні компанії з приставкою «ШІ” у своїх назвах, як-от BigBear.ШІ (приріст капіталізації на 300%), C3.ШІ (приріст капіталізації на 100%), BuzzFeed (+100%) і Guardforce (+51%).
По-друге, інвесторам потрібно навчитися бачити різницю між звичайним аналізом даних і штучним інтелектом. Деякі SaaS- та компанії з автоматизації позиціюють себе як ШІ-бренди. Але насправді використовують звичайну аналітику даних для організації робочих процесів. Їхні технології не стають розумнішими з часом та не забезпечують кращий аналіз і глибше розуміння користувача.
Тому важливо на початку з'ясувати, які технології використовує компанія: штучний інтелект чи базовий аналіз даних, та як вона створює власні data exhausts (великий шлейф даних, що компанія отримує з різних джерел). Крім того, варто дослідити, як компанія використовує машинне навчання, щоб зробити продукт більш самостійним, а залученість людей — меншою.
Врешті, інвесторам бажано проаналізувати, які ключові технології використовує стартап. Деякі компанії взагалі не мають жодних технологій, а просто використовують багато ручної роботи з країн з низьким рівнем доходу, а для залучення інвесторів видають це за штучний інтелект. Такі випадки швидше рідкість, аніж норма, втім, така проблема все ж існує.
***
Матеріал є спільною роботою клубу ангельських інвесторів ICLUB та венчурного фонду Roosh Ventures. Вперше оригінал опублікували англійською тут і тут.
Серед авторів — старший інвестиційний аналітик Roosh Ventures Іван Тараненко, аналітик Roosh Ventures Дмитро Сафонов та Володимир Дука з ICLUB.