Появился самый сильный соперник Seedance 2.0

Недавно в сфере генерации видео с помощью ИИ произошла громкая новость. Google тестирует новую модель генерации видео под кодовым названием Gemini Omni, и один пользователь случайно получил к ней доступ в приложении Gemini. Согласно просочившимся результатам тестирования, Gemini Omni демонстрирует впечатляющую производительность в нескольких ключевых сценариях и может стать самым сильным конкурентом, с которым Seedance 2.0 когда-либо сталкивался.
Что такое Gemini Omni?
Согласно просочившимся скриншотам, Gemini Omni описывается как «новая модель генерации видео от Google». Она поддерживает не только создание видео с нуля, но и переработку видео, редактирование в режиме диалога и создание на основе шаблонов. Проще говоря, цель — позволить пользователям изменять видеоконтент посредством диалоговых взаимодействий, а не просто «генерировать ролик».
Однако Google еще не выпустил официальный релиз, и доступ к тестированию был быстро отозван. Поэтому следующее сравнение основано в основном на тестовых клипах, появившихся в сети.
Тест 1: Рендеринг текста на сложной математической доске
Одной из долгосрочных проблем генерации видео с помощью ИИ является согласованность текста. Многие модели создают доски или листы бумаги с искаженным текстом, либо написание не совпадает между кадрами.
В просочившемся тесте кто-то использовал запрос из одного предложения для генерации 10-секундного видео с помощью Gemini Omni: профессор пишет на доске доказательство тригонометрического тождества и объясняет текущий шаг.
Результат показал, что математические формулы на доске в целом читаемы и оставались относительно стабильными на протяжении всего движения камеры. Хотя при внимательном рассмотрении все еще можно обнаружить некоторые артефакты ИИ, улучшение по сравнению с предыдущими моделями очевидно.
Для справедливого сравнения мы передали тот же запрос Seedance 2.0. Seedance 2.0 по-прежнему превосходит в фотореализме и освещении, но математическая точность содержания доски была немного нарушена, а часть текста оставалась размытой.
| Пункт сравнения | Gemini Omni (утекшая версия) | Seedance 2.0 |
|---|---|---|
| Визуальный реализм | Отлично | Отлично |
| Читаемость текста | Хорошо, формулы в основном читаемы | Средне, часть текста размыта |
| Стабильность камеры | Стабильно | Стабильно |
Этот тест показывает, что рендеринг текста становится новой ареной конкуренции между ведущими моделями. Для обучающих видео, требующих отображения текста, формул или интерфейсных операций, эта возможность особенно критична.
Тест 2: «Уилл Смит ест спагетти»
Этот запрос стал стандартным тестом для почти каждой модели генерации видео. Тест фокусируется на том, естественны ли движения персонажей, корректна ли физика объектов и последователен ли процесс еды.
В версии, сгенерированной Gemini Omni, внешний вид персонажа и атмосфера сцены были достаточно реалистичными. Однако некоторые зрители заметили проблему с деталями: на тарелке не было спагетти до того, как персонаж сел, но они появились после того, как он сел; затем во время еды лапша необъяснимо исчезла. Это указывает на то, что в модели все еще есть пробелы в длинноцепочечной физической логике.
Мы ввели тот же сложный запрос в Seedance 2.0. С точки зрения естественности действия приема пищи, Seedance 2.0 показал более плавную работу. Ритм жевания, движения рук и взаимодействие с едой были более согласованными с физикой реального мира.
| Пункт сравнения | Gemini Omni (утекшая версия) | Seedance 2.0 |
|---|---|---|
| Внешний вид персонажа | Фотореалистичный | Фотореалистичный |
| Атмосфера сцены | Сильное ощущение ресторана высокого класса | Отличное освещение и текстура |
| Согласованность действия приема пищи | Прерывистая, физика требует доработки | Более естественная, полная цепочка действий |
В этом раунде Seedance 2.0 оказался впереди по физике действий и логической согласованности.
Возможности редактирования видео Gemini Omni
Помимо генерации, Gemini Omni также продемонстрировал удивительные возможности редактирования видео. Например:
- Заменить спагетти в видео непосредственно на тайский том ям;
- Удалить водяной знак Sora из видео, сохраняя согласованность отснятого материала.
Если эта возможность сохранится при официальном выпуске, ее практическая ценность будет огромной. В настоящее время большинство инструментов видео с ИИ затрудняют вторичное редактирование после генерации. Подход «диалогового редактирования» Gemini Omni может изменить эту ситуацию.
Видео с ИИ выходит в мейнстрим
Независимо от конечной производительности Gemini Omni, одна тенденция очевидна: качество видео с ИИ быстро приближается к профессиональным стандартам производства.
Недавно несколько короткометражных фильмов, созданных с помощью Seedance 2.0, привлекли огромное внимание на социальных платформах. Например, короткометражный фильм с ИИ, получивший название «Китайский Любовь, смерть и роботы», был завершен создателем всего за 10 дней и уже получил предложения о сотрудничестве от киностудий. Видео с голубем, созданное техническим художником Runway Марко Славничем с использованием Seedance 2.0, набрало миллионы просмотров за короткое время, и многие комментаторы говорили, что «совершенно невозможно было догадаться, что это ИИ».
Эти случаи показывают, что видео с ИИ больше не игрушка — оно становится настоящим творческим инструментом.
Заключительные мысли
Случайная утечка Gemini Omni добавила больше топлива в гонку генерации видео с ИИ. Google может официально представить продукт на конференции I/O на следующей неделе, и его реальная производительность будет интересна.
Для обычных пользователей конкуренция между моделями — хорошая новость: качество генерации улучшается, барьеры входа снижаются, а выбор инструментов расширяется. Seedance 2.0 остается в верхнем эшелоне по качеству визуального ряда, физике действий и творческому рабочему процессу. Если вы хотите испытать новейшие возможности генерации видео с помощью ИИ, вы можете начать использовать его прямо сейчас.
Related searches: Seedance 2.0, Seedance tutorial, Seedance Chinese version, AI video generation comparison, Gemini Omni.