Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Чи можуть ШІ-стартапи послабити вплив NVIDIA на ринку процесорів

Олександр Тартачний
Олександр Тартачний журналіст
21 травня 2024 9 хвилин читання

Компанія NVIDIA подібно до часів золотої лихоманки продає устаткування, що приносить корпорації надприбутки. Однак не всі задоволені майже монополією техкомпанії. Низка стартапів намагається запропонувати краще та дешевше «залізо» для розроблення штучного інтелекту. The Economist з’ясовував, що пропонують конкуренти NVIDIA та які їхні шанси. SPEKA переповідає головне. 

Стартапи розробляють чипи для ШІ як альтернативу NVIDIA   Стартапи розробляють чипи для ШІ як альтернативу NVIDIA  

Чому NVIDIA так багато заробляє зараз?

«Хто контролює графічні процесори, той контролює всесвіт». Перифраз репліки з класичної наукової фантастики «Дюна». Доступ до графічних процесорів, зокрема тих, які виробляє NVIDIA, життєво важливий для будь-якої компанії, що хоче серйозно працювати із штучним інтелектом. Аналітики кажуть, що компанії «багаті GPU» або «бідні на GPU» залежно від кількості мікросхем у них. Технічні боси хваляться своїми гігантськими запасами. Домінування NVIDIA підвищило її ринкову вартість до понад $2 трлн. Очікується, що в останніх результатах, які будуть опубліковані 22 травня, компанія оголосить про зростання прибутку на понад 200% у порівнянні з минулим роком.

Графічні процесори (GPU) виконують обчислювальну роботу, необхідну для навчання та керування великими моделями ШІ. Але, як не дивно, вони створені не для цього. Ініціали означають «блок оброблення графіки», тому що такі чипи спочатку розробили для оброблення графіки відеоігор. Виявилося, що, на щастя для NVIDIA, їх можна перепрофілювати для робочих навантажень ШІ.

Чи було б краще створювати спеціалізовані мікросхеми штучного інтелекту з нуля? Саме це зараз роблять багато компаній, малих і великих, намагаючись повалити NVIDIA.

Спеціальні мікросхеми штучного інтелекту обіцяють зробити створення та запуск нейромереж швидшими, дешевшими або і те й інше.

Будь-яка фірма, що може створювати серйозну загрозу для чинного чемпіона, не матиме браку в клієнтах, яким не подобаються її високі ціни та обмежені пропозиції.

Звичайні процесорні мікросхеми, подібні до тих, що є у ноутбуках і настільних комп’ютерах, призначені для виконання однієї дії за іншою. Графічні процесори, навпаки, містять кілька тисяч механізмів оброблення, або ядер, які дають їм змогу запускати тисячі версій одного простого завдання одночасно (наприклад, малювання частини сцени).

Запуск моделей штучного інтелекту також передбачає паралельний запуск багатьох копій одного завдання. Розуміння того, як переписати код штучного інтелекту для роботи на графічних процесорах, було одним із чинників, які спровокували бум галузі.

У чому недолік графічних процесорів для розроблення штучного інтелекту

Графічні процесори мають свої обмеження, особливо коли йдеться про швидкість, з якою дані можуть перемішуватися на них і з них. Сучасні моделі ШІ працюють на великій кількості взаємопов’язаних графічних процесорів і мікросхем пам’яті. Швидке переміщення даних між ними є ключовим для продуктивності. Під час навчання дуже великих моделей штучного інтелекту деякі ядра графічного процесора можуть простоювати майже половину часу, поки вони очікують дані. Ендрю Фельдман, керівник стартапу Cerebras, порівнює це із затором у продуктовому магазині за день до Дня подяки.

Відповідь Cerebras полягає в тому, щоб помістити 900 тис. ядер, а також багато пам’яті на один величезний чип, щоб зменшити складність з’єднання кількох чипів і передаввання даних між ними. Його чип CS-3 є найбільшим у світі. «Наш чип має розмір обідньої тарілки, а графічний процесор розміром з поштову марку», — каже Фельдман. Cerebras стверджує, що внутрішньочипові з’єднання між ядрами працюють у сотні разів швидше, ніж з’єднання між окремими графічними процесорами, а його підхід зменшує споживання енергії більш ніж удвічі за заданого рівня продуктивності порівняно з найпотужнішою пропозицією від NVIDIA.

Огляд чипа CS -3 від Cerebras

Хто ще розробляє процесори для ШІ 

Groq, стартап із Каліфорнії, використовує інший підхід. Його мікросхеми штучного інтелекту, які називаються блоками оброблення мови (LPUs), оптимізовані для особливо швидкого запуску великих мовних моделей. Крім того що вони містять власну пам’ять, ці мікросхеми також діють як маршрутизатори, передаючи дані між взаємопов’язаними мікросхемами. Інтелектуальне програмне забезпечення маршрутизації усуває затримки часу, витраченого на очікування даних. Це значно підвищує ефективність, а отже, швидкість: Groq каже, що його LPU може запускати великі мовні моделі у десять разів швидше, ніж наявні системи.

Інші стартапи у цій галузі містять Hailo, що базується в Ізраїлі, який залучив $120 млн у квітні; Taalas, що базується в Торонто; Tenstorrent, американська фірма, яка використовує архітектуру RISC-V з відкритим кодом для створення чипів для ШІ.

 Великі технологічні компанії також створюють власні чипи. Google розробив власні тензорні процесори (TPU), які надає як службу хмарних обчислень. (Останню версію TPU, відому як Trillium, було представлено 14 травня.) Amazon, Meta та Microsoft також створили спеціальні чипи для хмарного ПЗ, Open AI планує це зробити, не кажучи вже про AMD та Intel, два провідні виробники мікросхем, які намагаються конкурувати з NVIDIA.

Де підводні камені для стартапів з розроблення чипів

Одна з небезпек для новачків полягає в тому, що їхні зусилля зі спеціалізації можуть зайти надто далеко. Розроблення чипа зазвичай триває два-три роки, каже Христос Козиракіс, комп’ютерний науковець зі Стенфордського університету, що є «величезною кількістю часу», враховуючи те, як швидко вдосконалюються моделі ШІ. Можливість, за його словами, полягає в тому, що стартапи можуть отримати чип, який краще працюватиме з майбутніми моделями, ніж менш спеціалізовані графічні процесори NVIDIA. Ризик полягає в тому, що вони спеціалізуються не на тому.

Раніше працюючи у Google, який розробив панівну натепер архітектуру штучного інтелекту «трансформер», яку використовують у переважній більшості великих мовних моделей, Райнер Поуп з MatX упевнений, що його фірма має «досить хорошу кришталеву кулю». І якщо новий підхід до архітектури ШІ під назвою state-space models стане популярним, його чип достатньо універсальний, щоб адаптуватися. Ендрю Фельдман каже, що весь сучасний штучний інтелект досі є просто «лінійною алгеброю» під капотом, що чип Cerebras може освоїти дуже швидко.

Інша проблема полягає в тому, що рівень програмного забезпечення NVIDIA для програмування графічних процесорів, відомий як CUDA, є де-факто галузевим стандартом, попри те що він, як відомо, складний у використанні.

«Програмне забезпечення — це ключове», — каже Козиракіс зі Стенфорду, і NVIDIA має значну перевагу, будуючи свою програмну екосистему протягом багатьох років. Стартапи з чипами штучного інтелекту досягнуть успіху, лише якщо їм вдасться переконати програмістів переналаштувати свій код для роботи на їхніх нових чипах. Вони пропонують пакети ПЗ для цього та забезпечують сумісність з основними фреймворками машинного навчання. Але налаштування програмного забезпечення для оптимізації продуктивності на новій архітектурі є складною справою. Це ще одна причина, чому NVIDIA важко відкинути.

Найбільші замовники чипів штучного інтелекту та систем, побудованих навколо них, це розробники моделей (як-от Open AI, Anthropic і Mistral) та технологічні гіганти (як Amazon, Meta, Microsoft і Google). Таким компаніям може бути доцільно придбати стартап із чипами штучного інтелекту та залишити його технологію при собі, сподіваючись перевершити конкурентів. Замість того щоб намагатися конкурувати з NVIDIA, стартапи могли б позиціонувати себе як цілі придбання.

Поуп каже, що MatX орієнтується на «вищий рівень» ринку, що свідчить про те, що він сподівається продати свої чипи, якщо не всю компанію, таким компаніям, як Open AI, Google або Anthropic, чиї моделі штучного інтелекту є найдосконалішими. «Ми були б раді багатьом видам виходу, — каже він, — але ми вважаємо, що тут є стійкий бізнес і в ролі окремої компанії». Зазначається, що Cerebras готується до первинного розміщення акцій. Поки що жоден зі стартапів не зробив бодай невеликого удару щодо домінантної позиції NVIDIA. Але є багато людей, які сподіваються, що хтось із них це зробить.

50 UAH 150 UAH 500 UAH 1000 UAH 3000 UAH 5000 UAH
0
Прокоментувати
Інші матеріали

Компанія OpenAI купує стартап Rockset за сотні $ млн

Владислав Паливода 3 години тому

ШІ-інструменти в смартфонах збиратимуть більше даних користувачів

Олеся Дерзська 8 годин тому

Meta запускає ШІ-чатбот на базі Llama-3 для всіх користувачів в Індії

Вікторія Рудзінська 12 годин тому

TikTok випадково виклав ШІ-інструмент, що дозволяв створювати відео з мовою ворожнечі

Вікторія Рудзінська 16 годин тому

Viber запровадив ШІ-зміст в усіх чатах

Олеся Дерзська 21 червня 2024 19:15