Anthropic випустила нову версію Claude, яка випереджає GPT-4 та Gemini

5 березня 2024 3 хвилин читання

ШІ-стартап Anthropic випустив нове сімейство мультимодальних моделей Claude 3, які у деяких тестах випереджають розробки від Google і OpenAI

Про це пише The Verge.

За даними Anthropic, моделі Claude 3 здатні відповідати на більшу кількість запитань, розуміти довші інструкції та надавати точніші відповіді порівняно з попередніми версіями. Крім того, оновлений чатбот може обробляти більше контексту та працювати із зображеннями.

Сімейство Claude 3 складається з трьох модифікацій:

  • Claude 3 Haiku — легка та швидка модель;
  • Claude 3 Sonnet — середня;
  • Claude 3 Opus — найпотужніша.

Opus і Sonnet вже доступні на claude.ai та його API, тоді як Haiku вийде найближчим часом.

Anthropic навчала моделі Claude 3 на поєднанні внутрішніх, сторонніх та загальнодоступних даних станом на серпень 2023 року. 

Для тренування компанія використовувала обладнання Amazon AWS та Google Cloud. Раніше обидва техногіганти інвестували в Anthropic.

Також Claude 3 буде доступна в бібліотеці моделей AWS Bedrock і в Vertex AI від Google.

Результати тестування моделей Claude 3

Згідно з Anthropic, нові моделі Claude 3 з меншою ймовірністю відмовлятимуться відповідати на підказки, що виходять за рамки системи безпеки, порівняно з попередніми версіями. Крім того, вони можуть майже миттєво обробляти складний матеріал, такий як наукові статті з діаграмами та графіками.

Хибні відмови Claude 3 у порівнянні із Claude 2.1

У кількох бенчмарках Opus показала кращі результати, ніж остання розробка OpenAI. Наприклад, у тесті на «Міркування на рівні випускника» (graduate-level reasoning ) модель від Anthropic набрала 50,4%, тоді як GPT-4 — 35,7%.

Opus також показала кращы результати у в математичних завданнях, кодуванні та розумінні міркувань.

Моделі Claude 3 порівняно з GPT-4, GPT-3.5 і Gemini 1.0 Ultra / Pro

Порівняно з Claude 2.1, нові моделі значно покращили свою швидкодію. Зокрема, Sonnet працює вдвічі швидше за Claude 2 та Claude 2.1.

Вона чудово справляється із завданнями, що вимагають швидкої реакції, такими як пошук знань або автоматизація продажів
Anthropic 

Раніше SPEKA писала про запуск чатбота Claude в Україні.