Створення відео із ШІ. Sora — прорив у нейромережах від OpenAI
Introducing Sora, our text-to-video model.
— OpenAI (@OpenAI) February 15, 2024
Sora can create videos of up to 60 seconds featuring highly detailed scenes, complex camera motion, and multiple characters with vibrant emotions. https://t.co/7j2JN27M3W
Prompt: “Beautiful, snowy… pic.twitter.com/ruTEWn87vf
Sora вміє генерувати складні сцени з кількома персонажами, точно передавати рухи об’єктів та малювати деталізоване тло. Готові відео видаються у високій якості 1080p та виглядають не гірше ніж гра Death Stranding чи сцена з останнього фільму Star Wars.
Можливості Sora
Новий штучний інтелект майже ідеально малює тварин і людей, а також уміє зображати переконливі емоції на обличчях персонажів. За допомогою Sora можна створювати сінематики з різними ракурсами та рухом камери. Фізика об’єктів, симуляція рідин та деталізація текстур — усе це також на високому рівні.
Prompt: “A stylish woman walks down a Tokyo street filled with warm glowing neon and animated city signage. she wears a black leather jacket, a long red dress, and black boots, and carries a black purse. she wears sunglasses and red lipstick. she walks confidently and casually.… pic.twitter.com/cjIdgYFaWq
— OpenAI (@OpenAI) February 15, 2024
За допомогою Sora можна:
Підписуйтеся на наші соцмережі
- генерувати відео з текстових запитів;
- анімувати статичні зображення;
- змінювати та покращувати наявні відео.
Нейромережа глибоко розуміє мову, що дозволяє їй з високою точністю інтерпретувати запити користувачів. Вона розуміє не лише те, що просять зобразити у промпті, але й те, як ці об’єкти взаємодіють у нашому фізичному світі.
Слабкості відеонейронки
Sora has its weaknesses according to @OpenAI such as: "Animals or people can spontaneously appear, especially in scenes containing many entities."
— Michael Daigler (@michaeldaigler_) February 15, 2024
Prompt: "Five gray wolf pups frolicking and chasing each other around a remote gravel road, surrounded by grass. The pups run and… pic.twitter.com/TjnjpIF4s8
Нейромережа може плутати просторові та часові деталі промпту, як-от ліворуч та праворуч, послідовність подій тощо. Sora також може мати проблеми з точним моделюванням фізики складних сцен і не розуміти зв’язків причини та наслідку.
Як користуватися Sora
Щоб отримати ШІ-згенероване відео у Sora, потрібно прописати чіткий промпт — так само, як і для роботи з іншим продуктом від OpenAI, генератором зображень з тексту DALL-E. Зазвичай це одне-два речення, в яких необхідно описати те, що має відбуватися на відео, та вказати деталі, стиль, кольори, кількість об’єктів чи персонажів тощо.
Ризики нового ШІ
Перед тим як зробити Sora доступною для широкої аудиторії, OpenAI планує вжити низку безпекових заходів. Компанія працює з експертами у галузях дезінформації та інформаційної гігієни, які тестують модель на безпекові ризики. Також OpenAI створює інструменти, що допоможуть виявляти ШІ-контент, згенерований Sora.
До розмов про те, що ШІ-згенерований контент здатний поширювати дезінформацію, можна ставитися по-різному. У дискусії про нову нейромережу в Х один із користувачів запостив документальне відео «Невідомий бунтар», де чоловік наодинці стримує колону танків під час студентських заворушень у Китаї у червні 1989-го, та пожартував, що нібито це згенерувала Sora.
BREAKING: OpenAI just launched Sora, an AI model that can create 60-second videos from just text prompts. The video below was 100% created by Sora.
— opdroid1234 (@opdroid1234) February 16, 2024
Prompt: Obstinate man creates an incident that serves as a symbol for the power of an individual against an overarching state pic.twitter.com/nomKi223Pg
Інший користувач відповів йому: «Можливо, майбутні покоління будуть думати, що кадри Хіросіми та Нагасакі також є ШІ-згенерованими».