Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Найкращі ШІ-моделі 2025 року за версією користувачів: рейтинг LMArena

0
14 червня 2025 2 хвилин читання

На фоні активного розвитку генеративного штучного інтелекту дедалі більше компаній заявляють, що саме їхні моделі є найефективнішими. Проте у більшості випадків оцінювання таких моделей здійснюється самими розробниками — на основі внутрішніх тестів, вибіркових бенчмарків або закритих метрик. Альтернативний підхід пропонує платформа LMArena, яка формує відкритий рейтинг ШІ-моделей на основі голосування звичайних користувачів.

Найкращі ШІ-моделі 2025 року за версією користувачів: рейтинг LMArena зображення 1

LMArena дає змогу порівнювати якість генерації ШІ у кількох напрямках — текст, код, зображення, аналітика даних, розпізнавання об'єктів. У режимі «Side by Side» користувачі можуть безкоштовно протестувати дві анонімні моделі, поставивши їм однакове запитання або завдання. Після перегляду відповідей необхідно обрати кращу (або вказати, що обидві відповіді слабкі). Лише після голосування відкриваються назви моделей, які взяли участь у порівнянні. Саме на базі таких результатів формується динамічний рейтинг ШІ, що регулярно оновлюється.

Підписуйтеся на наші соцмережі

Водночас дослідницька організація Bellingcat оцінила ефективність популярних ШІ-моделей у складнішому завданні — визначенні геолокації за фотографією. У межах дослідження, опублікованого, 20 моделей штучного інтелекту проаналізували 25 зображень, виконуючи 500 спроб загалом.

Основні висновки:

  • точне визначення місця за фото залишається складним завданням навіть для найсучасніших моделей;
  • значна частина відповідей містила помилки або «галюцинації»;
  • деякі моделі робили припущення на основі особистої інформації користувачів.

Так, наприклад, GPT o4-mini у відповіді припустив, що зображення зроблено в Колорадо, оскільки користувач «раніше згадував цю локацію» у спілкуванні. У свою чергу, Grok, імовірно, ґрунтувався на вмісті профілю користувача в соцмережі X (Twitter), зокрема на попередніх публікаціях.

0
Icon 0

Підписуйтеся на наші соцмережі

Інші матеріали

Стартап, який змінює правила гри на Amazon

Alina Shcherbyna 6 годин тому

Самоаудит: як знайти та виправити помилки завчасно

Ірина Качмарчик 2 години тому

Про емоційний інтелект, вигорання та міленіалів в робочому колективі.

Роман Крючок 5 годин тому

Проєкт “Відпустка”: як якісно відпочити від роботи?

Анастасія Зубенко 11 липня 2025 19:15

REDOX проточні акумуляторні батареї: технологія накопичення що змінює майбутнє

Сергій Маринець 7 годин тому