Упс! Не вдала спроба:(
Будь ласка, спробуйте ще раз.

Tencent запускає HunyuanVideo — відкриту модель генерації відео на основі ШІ

Павло Бартос
Павло Бартос
4 грудня 2024 3 хвилин читання

Китайська технологічна компанія Tencent анонсувала запуск HunyuanVideo — новаторської моделі генерації відео, яка має відкритий вихідний код, повідомляє Neowin. Це перша велика модель генерації відео з відкритими параметрами, що обіцяє революцію в екосистемі генерації відео.

Що таке HunyuanVideo

HunyuanVideo — це сучасна генеративна модель штучного інтелекту для створення відео з текстових підказок. З 13 мільярдами параметрів вона є найбільшою відкритою моделлю у своєму класі. Tencent стверджує, що HunyuanVideo:

Підписуйтеся на наші соцмережі

  • Забезпечує високу візуальну якість відео.
  • Пропонує широкий діапазон рухів і відповідність між текстом та відео.
  • Перевершує провідні закриті моделі, такі як Runway Gen-3 і Luma 1.6.

HunyuanVideo базується на конструкції трансформера із застосуванням механізму Full Attention для уніфікованої генерації зображень і відео. Такий підхід до побудови моделі включає:

  • 1
    Гібридну архітектуру "двопотоковий-однопотоковий". На початковому етапі текстові та відео токени обробляються окремо для оптимізації модальностей, а пізніше ці потоки об'єднуються.
  • 2
    Комплексну інтеграцію тексту та візуальних даних. Це дозволяє створювати відео з реалістичною динамікою та чітким відповідником до текстових запитів.

Як тестували HunyuanVideo

Tencent провела оцінку HunyuanVideo за участю людей. Результати показали, що модель перевершує всі сучасні закриті аналоги за такими параметрами:

  • Візуальна якість.
  • Стабільність генерації.
  • Різноманітність рухів.

Tencent надала HunyuanVideo у відкритому доступі, включаючи вихідний код і “ваги” моделі. Це відкриває нові можливості для дослідників, стартапів і технологічних компаній, дозволяючи використовувати модель для:

  • Розробки кастомних рішень генерації відео.
  • Інтеграції у мультимедійні застосунки та проєкти.
  • Розвитку технологій ШІ з акцентом на відеоконтент.

Tencent оголосила, що публікація коду та параметрів базової моделі спрямована на скорочення розриву між моделями з відкритим і закритим кодом. Це допоможе зробити створення якісних відео на основі штучного інтелекту більш доступним. Відкритий код HunyuanVideo можна знайти на GitHub.

Підписуйтеся на наші соцмережі

0
Прокоментувати
Інші матеріали

Українські МСП можуть отримати до €67 500 на інноваційні робототехнічні рішення від ЄС

Світлана Бовшовська 2 години тому

Маркетингові стратегії для e-commerce: як масштабувати продажі у 2025 році

Олександр Христич 10 годин тому

OpenAI запускає комп'ютерного агента Operator для автоматизації вебзавдань

Вікторія Рудзінська 22 години тому

Українські підлітки вдруге візьмуть участь у міжнародному техатоні Teens in AI: старт реєстрації

Новини Мінцифри 23 січня 2025 16:45

IT SmartFlex: від внутрішніх рішень для Vodafone до виходу на зовнішній ринок

Олександр Тартачний 23 січня 2025 15:35