Ha aparecido el rival más fuerte de Seedance 2.0

Recientemente, se ha producido una noticia importante en el campo de la generación de video con IA. Google está probando un nuevo modelo de generación de video con el nombre en clave Gemini Omni, y un usuario logró acceder accidentalmente a él dentro de la aplicación Gemini. Según los resultados de las pruebas filtradas, Gemini Omni funciona excepcionalmente bien en varios escenarios clave y podría ser el rival más fuerte que Seedance 2.0 ha enfrentado hasta ahora.
¿Qué es Gemini Omni?
Según las capturas de pantalla filtradas, Gemini Omni se describe como el “nuevo modelo de generación de video de Google”. No solo supports la generación de videos desde cero, sino también la إعادةmezcla de video, la edición conversacional y la creación basada en plantillas. En pocas palabras, busca permitir que los usuarios modifiquen el contenido del video a través de interacciones similares al chat, no solo “generar un clip”.
Sin embargo, Google aún no lo ha lanzado oficialmente, y el acceso a las pruebas filtradas fue rápidamente revocado. Por lo tanto, la siguiente comparación se basa principalmente en clips de prueba que han aparecido en línea.
Prueba 1: Renderizado de texto de pizarra matemática compleja
Uno de los problemas más persistentes en la generación de video con IA es la coherencia del texto. Muchos modelos producen pizarras o hojas de papel con texto garabateado, o la escritura no coincide entre tomas.
En la prueba filtrada, alguien usó un indicador de una oración para generar un video de 10 segundos con Gemini Omni: un profesor escribe una prueba de identidad trigonométrica en una pizarra y explica el paso actual.
El resultado mostró que las fórmulas matemáticas en la pizarra eran generalmente legibles y permanecían relativamente estables durante el movimiento de la cámara. Aunque una inspección cuidadosa aún revela algunos artefactos de IA, la mejora respecto a modelos anteriores es clara.
Para una comparación justa, alimentamos el mismo indicador a Seedance 2.0. Seedance 2.0 sigue destacando en fotorrealismo e iluminación, pero la precisión matemática del contenido de la pizarra era ligeramente incorrecta, con parte del texto que permanecía borroso.
| Elemento de comparación | Gemini Omni (Filtrado) | Seedance 2.0 |
|---|---|---|
| Realismo visual | Excelente | Excelente |
| Legibilidad del texto | Buena, fórmulas mayormente legibles | Promedio, algo de texto borroso |
| Estabilidad de la cámara | Estable | Estable |
Esta prueba muestra que el renderizado de texto se está convirtiendo en un nuevo campo de batalla entre los modelos de primera línea. Para videos instructivos que necesitan mostrar texto, fórmulas u operaciones de interfaz, esta capacidad es particularmente crítica.
Prueba 2: “Will Smith comiendo spaghetti”
Este indicador se ha convertido en un punto de referencia estándar para casi todos los modelos de generación de video. La prueba se centra en si los movimientos de los personajes son naturales, si la física de los objetos es correcta y si el proceso de alimentación es coherente.
En la versión generada por Gemini Omni, la apariencia del personaje y la atmósfera de la escena eran bastante realistas. Sin embargo, algunos espectadores notaron un problema de detalle: no había spaghetti en el plato antes de que el personaje se sentara, pero apareció después de sentarse; luego, durante la comida, los fideos desaparecieron inexplicablemente. Esto indica que el modelo aún tiene lagunas en la física de cadena larga.
Ingresamos el mismo indicador complejo en Seedance 2.0. En términos de naturalidad de la acción de comer, Seedance 2.0 funcionó más suavemente. El ritmo de masticación, los movimientos de las manos y la interacción con la comida eran más consistentes con la física del mundo real.
| Elemento de comparación | Gemini Omni (Filtrado) | Seedance 2.0 |
|---|---|---|
| Apariencia del personaje | Fotorrealista | Fotorrealista |
| Atmósfera de la escena | Fuerte sensación de restaurante exclusivo | Excelente iluminación y textura |
| Coherencia de la acción de comer | Discontinua, la física necesita trabajo | Más natural, cadena de acción completa |
En esta ronda, Seedance 2.0 tomó la delantera en física de acción y coherencia lógica.
Capacidades de edición de video de Gemini Omni
Más allá de la generación, Gemini Omni también demostró sorprendentes capacidades de edición de video. Por ejemplo:
- Reemplazar el spaghetti en un video directamente con un tazón de sopa tailandesa de tom yum;
- Eliminar una marca de agua de Sora de un video mientras se mantiene la consistencia del metraje.
Si esta capacidad se mantiene en el lanzamiento oficial, su valor práctico será enorme. Actualmente, la mayoría de las herramientas de video con IA hacen difícil la edición secundaria después de la generación. El enfoque de “edición conversacional” de Gemini Omni podría cambiar ese status quo.
El video con IA se está volviendo convencional
Independientemente del rendimiento final de Gemini Omni, una tendencia es clara: la calidad del video con IA se está acercando rápidamente a los estándares de producción profesional.
recientemente, varios cortos creados con Seedance 2.0 han ganado una atención masiva en las plataformas sociales. Por ejemplo, un cortometraje con IA apodado “China’s Love, Death & Robots” fue completado por su creador en solo 10 días y ya ha recibido ofertas de colaboración de estudios de cine. Un video de paloma hecho por el artista técnico de Runway Marko Slavnic usando Seedance 2.0 acumuló millones de visitas en poco tiempo, con muchos comentaristas diciendo que “no podían decir que era IA en absoluto”.
Estos casos muestran que el video con IA ya no es un juguete: se está convirtiendo en una verdadera herramienta creativa.
Reflexiones finales
La filtración accidental de Gemini Omni ha añadido más combustible a la carrera de generación de video con IA. Google podría presentar oficialmente el producto en la conferencia de I/O de la próxima semana, y su rendimiento en el mundo real valdrá la pena observar.
Para los usuarios cotidianos, la competencia entre modelos es una buena noticia: la calidad de generación está mejorando, las barreras de entrada están disminuyendo y la elección de herramientas se está expandiendo. Seedance 2.0 permanece en la primera categoría en calidad visual, física de acción y flujo de trabajo creativo. Si quieres experimentar lo último en generación de video con IA, puedes comenzar a usarlo de inmediato.
Related searches: Seedance 2.0, Seedance tutorial, Seedance Chinese version, AI video generation comparison, Gemini Omni.