Anthropic випустила нову версію Claude, яка випереджає GPT-4 та Gemini
Про це пише The Verge.
За даними Anthropic, моделі Claude 3 здатні відповідати на більшу кількість запитань, розуміти довші інструкції та надавати точніші відповіді порівняно з попередніми версіями. Крім того, оновлений чатбот може обробляти більше контексту та працювати із зображеннями.
Сімейство Claude 3 складається з трьох модифікацій:
- Claude 3 Haiku — легка та швидка модель;
- Claude 3 Sonnet — середня;
- Claude 3 Opus — найпотужніша.
Opus і Sonnet вже доступні на claude.ai та його API, тоді як Haiku вийде найближчим часом.
Anthropic навчала моделі Claude 3 на поєднанні внутрішніх, сторонніх та загальнодоступних даних станом на серпень 2023 року.
Для тренування компанія використовувала обладнання Amazon AWS та Google Cloud. Раніше обидва техногіганти інвестували в Anthropic.
Також Claude 3 буде доступна в бібліотеці моделей AWS Bedrock і в Vertex AI від Google.
Результати тестування моделей Claude 3
Згідно з Anthropic, нові моделі Claude 3 з меншою ймовірністю відмовлятимуться відповідати на підказки, що виходять за рамки системи безпеки, порівняно з попередніми версіями. Крім того, вони можуть майже миттєво обробляти складний матеріал, такий як наукові статті з діаграмами та графіками.
![Хибні відмови Claude 3 у порівнянні із Claude 2.1](https://images.weserv.nl/?w=715&we=1&n=-1&url=https%3A%2F%2Fnewspeka.fra1.digitaloceanspaces.com%2Fprod%2Fmedia%2F72177%2F1709662658916.jpg%3Fv%3D1709662658)
У кількох бенчмарках Opus показала кращі результати, ніж остання розробка OpenAI. Наприклад, у тесті на «Міркування на рівні випускника» (graduate-level reasoning ) модель від Anthropic набрала 50,4%, тоді як GPT-4 — 35,7%.
Opus також показала кращы результати у в математичних завданнях, кодуванні та розумінні міркувань.
![Моделі Claude 3 порівняно з GPT-4, GPT-3.5 і Gemini 1.0 Ultra / Pro](https://images.weserv.nl/?w=715&we=1&n=-1&url=https%3A%2F%2Fnewspeka.fra1.digitaloceanspaces.com%2Fprod%2Fmedia%2F72178%2F1709662669184.jpg%3Fv%3D1709662669)
Порівняно з Claude 2.1, нові моделі значно покращили свою швидкодію. Зокрема, Sonnet працює вдвічі швидше за Claude 2 та Claude 2.1.
Раніше SPEKA писала про запуск чатбота Claude в Україні.