Появился самый сильный соперник Seedance 2.0

Недавно в сфере генерации видео с помощью ИИ произошла громкая новость. Google тестирует новую модель генерации видео под кодовым названием Gemini Omni, и один пользователь случайно получил к ней доступ в приложении Gemini. Согласно просочившимся результатам тестирования, Gemini Omni демонстрирует впечатляющую производительность в нескольких ключевых сценариях и может стать самым сильным конкурентом, с которым Seedance 2.0 когда-либо сталкивался.

Что такое Gemini Omni?

Согласно просочившимся скриншотам, Gemini Omni описывается как «новая модель генерации видео от Google». Она поддерживает не только создание видео с нуля, но и переработку видео, редактирование в режиме диалога и создание на основе шаблонов. Проще говоря, цель — позволить пользователям изменять видеоконтент посредством диалоговых взаимодействий, а не просто «генерировать ролик».

Однако Google еще не выпустил официальный релиз, и доступ к тестированию был быстро отозван. Поэтому следующее сравнение основано в основном на тестовых клипах, появившихся в сети.

Тест 1: Рендеринг текста на сложной математической доске

Одной из долгосрочных проблем генерации видео с помощью ИИ является согласованность текста. Многие модели создают доски или листы бумаги с искаженным текстом, либо написание не совпадает между кадрами.

В просочившемся тесте кто-то использовал запрос из одного предложения для генерации 10-секундного видео с помощью Gemini Omni: профессор пишет на доске доказательство тригонометрического тождества и объясняет текущий шаг.

Результат показал, что математические формулы на доске в целом читаемы и оставались относительно стабильными на протяжении всего движения камеры. Хотя при внимательном рассмотрении все еще можно обнаружить некоторые артефакты ИИ, улучшение по сравнению с предыдущими моделями очевидно.

Для справедливого сравнения мы передали тот же запрос Seedance 2.0. Seedance 2.0 по-прежнему превосходит в фотореализме и освещении, но математическая точность содержания доски была немного нарушена, а часть текста оставалась размытой.

Пункт сравнения	Gemini Omni (утекшая версия)	Seedance 2.0
Визуальный реализм	Отлично	Отлично
Читаемость текста	Хорошо, формулы в основном читаемы	Средне, часть текста размыта
Стабильность камеры	Стабильно	Стабильно

Этот тест показывает, что рендеринг текста становится новой ареной конкуренции между ведущими моделями. Для обучающих видео, требующих отображения текста, формул или интерфейсных операций, эта возможность особенно критична.

Тест 2: «Уилл Смит ест спагетти»

Этот запрос стал стандартным тестом для почти каждой модели генерации видео. Тест фокусируется на том, естественны ли движения персонажей, корректна ли физика объектов и последователен ли процесс еды.

В версии, сгенерированной Gemini Omni, внешний вид персонажа и атмосфера сцены были достаточно реалистичными. Однако некоторые зрители заметили проблему с деталями: на тарелке не было спагетти до того, как персонаж сел, но они появились после того, как он сел; затем во время еды лапша необъяснимо исчезла. Это указывает на то, что в модели все еще есть пробелы в длинноцепочечной физической логике.

Мы ввели тот же сложный запрос в Seedance 2.0. С точки зрения естественности действия приема пищи, Seedance 2.0 показал более плавную работу. Ритм жевания, движения рук и взаимодействие с едой были более согласованными с физикой реального мира.

Пункт сравнения	Gemini Omni (утекшая версия)	Seedance 2.0
Внешний вид персонажа	Фотореалистичный	Фотореалистичный
Атмосфера сцены	Сильное ощущение ресторана высокого класса	Отличное освещение и текстура
Согласованность действия приема пищи	Прерывистая, физика требует доработки	Более естественная, полная цепочка действий

В этом раунде Seedance 2.0 оказался впереди по физике действий и логической согласованности.

Возможности редактирования видео Gemini Omni

Помимо генерации, Gemini Omni также продемонстрировал удивительные возможности редактирования видео. Например:

Заменить спагетти в видео непосредственно на тайский том ям;
Удалить водяной знак Sora из видео, сохраняя согласованность отснятого материала.

Если эта возможность сохранится при официальном выпуске, ее практическая ценность будет огромной. В настоящее время большинство инструментов видео с ИИ затрудняют вторичное редактирование после генерации. Подход «диалогового редактирования» Gemini Omni может изменить эту ситуацию.

Видео с ИИ выходит в мейнстрим

Независимо от конечной производительности Gemini Omni, одна тенденция очевидна: качество видео с ИИ быстро приближается к профессиональным стандартам производства.

Недавно несколько короткометражных фильмов, созданных с помощью Seedance 2.0, привлекли огромное внимание на социальных платформах. Например, короткометражный фильм с ИИ, получивший название «Китайский Любовь, смерть и роботы», был завершен создателем всего за 10 дней и уже получил предложения о сотрудничестве от киностудий. Видео с голубем, созданное техническим художником Runway Марко Славничем с использованием Seedance 2.0, набрало миллионы просмотров за короткое время, и многие комментаторы говорили, что «совершенно невозможно было догадаться, что это ИИ».

Эти случаи показывают, что видео с ИИ больше не игрушка — оно становится настоящим творческим инструментом.

Заключительные мысли

Случайная утечка Gemini Omni добавила больше топлива в гонку генерации видео с ИИ. Google может официально представить продукт на конференции I/O на следующей неделе, и его реальная производительность будет интересна.

Для обычных пользователей конкуренция между моделями — хорошая новость: качество генерации улучшается, барьеры входа снижаются, а выбор инструментов расширяется. Seedance 2.0 остается в верхнем эшелоне по качеству визуального ряда, физике действий и творческому рабочему процессу. Если вы хотите испытать новейшие возможности генерации видео с помощью ИИ, вы можете начать использовать его прямо сейчас.

Начать использовать Seedance 2.0

Related searches: Seedance 2.0, Seedance tutorial, Seedance Chinese version, AI video generation comparison, Gemini Omni.