З'явився найсильніший суперник Seedance 2.0

Нещодавно у сфері генерації відео зі штучним інтелектом з’явилася важлива новина. Google тестує абсолютно нову модель генерації відео з кодовою назвою Gemini Omni, і один користувач випадково отримав до неї доступ у додатку Gemini. Згідно з витоком результатів тестування, Gemini Omni демонструє вражаючі результати в кількох ключових сценаріях і може бути найсильнішим конкурентом, з яким Seedance 2.0 стикався досі.

Що таке Gemini Omni

Згідно з витоком скріншотів, Gemini Omni описано як «нову модель генерації відео Google». Вона підтримує не лише генерацію відео з нуля, але й відеоремікс, розмовне редагування та використання шаблонів. Якщо коротко, її мета — не просто «згенерувати відео», а дозволити користувачам змінювати вміст відео за допомогою чатоподібних взаємодій.

Однак Google ще офіційно не випустила цей продукт, і виток тестового доступу був швидко закрито. Тому наступний порівняльний аналіз базується переважно на тестових кліпах, що з’явилися в інтернеті.

Тест 1: Рендеринг тексту на складній математичній дошці

Однією з головних проблем генерації відео зі ШІ є узгодженість тексту. Багато моделей створюють дошки або аркуші паперу з нерозбірливим текстом, або написання не збігається між кадрами.

У витоку тесту хтось використав одне речення-промпт для генерації 10-секундного відео за допомогою Gemini Omni: професор пише на дошці доведення тригонометричної тотожності та пояснює поточний крок.

Із результатів видно, що математичні формули на дошці загалом розбірливі та залишалися відносно стабільними під час руху камери. Хоча ретельніший огляд все ще виявляє деякі артефакти ШІ, покращення порівняно з попередніми моделями очевидне.

Для справедливого порівняння ми дали той самий промпт Seedance 2.0. Seedance 2.0 як і раніше демонструє чудовий фотореалізм та освітлення, але математична точність вмісту дошки була дещо відхилена, а деякий текст залишався розмитим.

Пункт порівняння	Gemini Omni (витік)	Seedance 2.0
Візуальний реалізм	Відмінно	Відмінно
Читабельність тексту	Добре, формули здебільшого розбірливі	Середньо, деякий текст розмитий
Стабільність камери	Стабільна	Стабільна

Цей тест показує, що рендеринг тексту стає новим полем бою між провідними моделями. Для навчальних відео, які потребують відображення тексту, формул чи операцій інтерфейсу, це особливо важливо.

Тест 2: «Вілл Сміт їсть спагеті»

Цей промпт став обов’язковим «іспитом» для більшості моделей генерації відео. Тест фокусується на тому, чи є рухи персонажа природними, чи є фізика об’єктів правильною, та чи є процес їжі узгодженим.

У версії, згенерованій Gemini Omni, зовнішній вигляд персонажа та атмосфера сцени були досить реалістичними. Однак деякі глядачі помітили проблему з деталлю: перед тим, як персонаж сів, на тарілці не було спагеті, але вони з’явилися після того, як він сів; потім під час їжі локшина таємничо зникла. Це вказує на те, що модель все ще має прогалини в логіці довгої фізичної ланцюга.

Ми ввели той самий комплексний промпт у Seedance 2.0. Щодо природності рухів їжі, Seedance 2.0 працював плавніше. Ритм жування, рухи рук та взаємодія з їжею були більш узгодженими з реальною фізикою.

Пункт порівняння	Gemini Omni (витік)	Seedance 2.0
Зовнішній вигляд персонажа	Фотореалістичний	Фотореалістичний
Атмосфера сцени	Сильне відчуття розкішного ресторану	Відмінна якість світла та текстури
Узгодженість рухів їжі	Переривчаста, фізика потребує доопрацювання	Більш природна, повний ланцюжок рухів

У цьому раунді Seedance 2.0 трохи випередив у логіці фізики рухів.

Можливості редагування відео Gemini Omni

На додаток до генерації, Gemini Omni також продемонстрував вражаючі можливості редагування відео. Наприклад:

Заміна спагеті у відео безпосередньо на миску тайського супу том ям;
Видалення водяного знака Sora з відео зі збереженням узгодженості відео.

Якщо ця функція збережеться у фінальній версії, її практична цінність буде величезною. Наразі більшість інструментів відео зі ШІ ускладнюють вторинне редагування після генерації. Підхід «розмовного редагування» Gemini Omni може змінити цей статус-кво.

Відео зі ШІ виходить у мейнстрім

Незалежно від кінцевої продуктивності Gemini Omni, одна тенденція очевидна: якість відео зі ШІ швидко наближається до професійних стандартів виробництва.

Нещодавно кілька короткометражних фільмів, створених за допомогою Seedance 2.0, привернули величезну увагу на соціальних платформах. Наприклад, короткометражний фільм зі ШІ під назвою «Китайський Любов, смерть та роботи» був завершений його творцем лише за 10 днів і вже отримав пропозиції про співпрацю від кіностудій. Відео з голубом, створене технічним художником Runway Марко Славніком за допомогою Seedance 2.0, за короткий час набрало мільйони переглядів, а багато коментаторів сказали, що «зовсім не видно, що це ШІ».

Ці випадки показують, що відео зі ШІ більше не іграшка — воно стає справжнім креативним інструментом.

Заключні думки

Випадковий витік Gemini Omni додав більше пального у перегони з генерації відео зі ШІ. Google може офіційно оголосити про цей продукт на конференції I/O наступного тижня, і його реальну продуктивність варто буде спостерігати.

Для звичайних користувачів конкуренція між моделями — хороша новина: якість генерації покращується, бар’єри входу знижуються, а вибір інструментів зростає. Seedance 2.0 залишається в топ-категорії за візуальною якістю, логікою фізики рухів та креативним робочим процесом. Якщо ви хочете відчути сучасні можливості генерації відео зі ШІ, ви можете почати вже зараз.

Почати використовувати Seedance 2.0

Пов’язані пошуки: Seedance 2.0, навчальний посібник Seedance, китайська версія Seedance, порівняння генерації відео зі ШІ, Gemini Omni.