Seedance Logo Seedance
Blog

Le rival le plus fort de Seedance 2.0 est apparu

Seedance

Le rival le plus fort de Seedance 2.0 est apparu

Récemment, une fuite majeure a secoué le domaine de la génération de vidéo par IA. Google teste apparemment un nouveau modèle de génération de vidéo codéommé Gemini Omni, et un utilisateur a accidentellement déclenché son accès dans l’application Gemini. Selon les résultats des tests fuités, Gemini Omni offre des performances remarquables dans plusieurs scénarios clés et pourrait être le rival le plus redoutable jamais rencontré par Seedance 2.0.

Qu’est-ce que Gemini Omni?

Selon les captures d’écran fuiées, Gemini Omni est décrit comme le “nouveau modèle de génération de vidéo de Google”. Il prend en charge non seulement la génération de vidéos à partir de zéro, mais également le remix vidéo, l’édition conversationnelle et la création basée sur des modèles. En bref, il vise à permettre aux utilisateurs de modifier le contenu vidéo par des interactions similaires au chat, et non pas seulement à “générer un clip”.

Cependant, Google ne l’a pas encore officiellement publié, et l’accès aux tests fuités a été rapidement révoqué. Ainsi, la comparaison suivante est principalement basée sur des clips de test qui ont fuité en ligne.

Test 1: Rendu de texte de tableau noir mathématique complexe

L’un des problèmes de longue date dans la génération de vidéo par IA est la cohérence du texte. De nombreux modèles produisent des tableaux noirs ou des feuilles de papier avec du texte illisible, ou l’écriture ne correspond pas d’un plan à l’autre.

Dans le test fuié, quelqu’un a utilisé une invite d’une phrase pour générer une vidéo de 10 secondes avec Gemini Omni: un professeur écrit une preuve d’identité trigonométrique sur un tableau noir et explique l’étape en cours.

Le résultat a montré que les formules mathématiques sur le tableau noir étaient généralement lisibles et sont restées relativement stables tout au long du mouvement de la caméra. Bien qu’une inspection attentive révèle encore quelques artifacts IA, l’amélioration par rapport aux modèles précédents est nette.

Pour une comparaison équitable, nous avons soumis la même invite à Seedance 2.0. Seedance 2.0 excelle toujours en photoréalisme et en éclairage, mais la précision mathématique du contenu du tableau était légèrement erronée, avec certains textes encore flous.

Élément de comparaisonGemini Omni (Fuié)Seedance 2.0
Réalisme visuelExcellentExcellent
Lisibilité du texteBonne, formules généralement lisiblesMoyenne, certains textes flous
Stabilité de la caméraStableStable

Ce test montre que le rendu de texte devient un nouveau champ de bataille entre les modèles de premier plan. Pour les vidéos pédagogiques qui doivent afficher du texte, des formules ou des opérations d’interface, cette capacité est particulièrement critique.

Test 2: “Will Smith mangeant des spaghetti”

Cette invite est devenue un benchmark standard pour presque tous les modèles de génération de vidéo. Le test se concentre sur la question de savoir si les mouvements des personnages sont naturels, si la physique des objets est correcte et si le processus alimentaire est cohérent.

Dans la version générée par Gemini Omni, l’apparence du personnage et l’atmosphère de la scène étaient assez réalistes. Cependant, certains spectateurs ont remarqué un problème de détail: il n’y avait pas de spaghetti dans l’assiette avant que le personnage ne s’assoie, mais ils sont apparus après qu’il se soit assis; puis pendant le repas, les nouilles ont inexplicable disparu. Cela indique que le modèle a toujours des lacunes dans la physique des chaînes longues.

Nous avons entré la même invite complexe dans Seedance 2.0. En termes de naturalité de l’action de manger, Seedance 2.0 a performed plus facilement. Le rythme de mastication, les mouvements des mains et l’interaction avec la nourriture étaient plus conformes à la physique du monde réel.

Élément de comparaisonGemini Omni (Fuié)Seedance 2.0
Apparence du personnagePhotoréalistePhotoréaliste
Atmosphère de la scèneForte impression de restaurant haut de gammeÉclairage et texture excellents
Cohérence de l’action de mangerDiscontinue, la physique doit être amélioréePlus naturelle, chaîne d’actions complète

Dans ce round, Seedance 2.0 a pris l’avantage en matière de physique des actions et de cohérence logique.

Capacités d’édition vidéo de Gemini Omni

Au-delà de la génération, Gemini Omni a également démontré des capacités d’édition vidéo surprenantes. Par exemple:

  • Remplacer directement les spaghetti dans une vidéo par un bol de soupe thaïlandaise tom yum;
  • Supprimer un filigrane Sora d’une vidéo tout en maintenant la cohérence des images.

Si cette capacité est conservée lors du lancement officiel, sa valeur pratique sera énorme. Actuellement, la plupart des outils vidéo IA rendent difficile l’édition secondaire après la génération. L’approche d‘“édition conversationnelle” de Gemini Omni pourrait changer ce statu quo.

La vidéo IA devient grand public

Quelle que soit la performance finale de Gemini Omni, une tendance est claire: la qualité de la vidéo IA se rapproche rapidement des normes de production professionnelle.

Récemment, plusieurs courts métrages créés avec Seedance 2.0 ont gagné une attention massive sur les plateformes sociales. Par exemple, un court métrage IA surnommé “Love, Death & Robots chinois” a été terminé par son créateur en seulement 10 jours et a déjà reçu des offres de collaboration de studios de cinéma. Une vidéo de pigeon faite par l’artiste technique de Runway Marko Slavnic utilisant Seedance 2.0 a accumulé des millions de vues en peu de temps, avec de nombreux commentateurs disant qu’ils “ne pouvaient pas dire que c’était de l’IA”.

Ces cas montrent que la vidéo IA n’est plus un jouet—elle devient un véritable outil créatif.

Réflexions finales

La fuite accidentelle de Gemini Omni a ajouté plus de carburant à la course à la génération de vidéo par IA. Google pourrait officiellement dévoiler le produit lors de la conférence I/O de la semaine prochaine, et sa performance dans le monde réel vaudra la peine d’être observée.

Pour les utilisateurs quotidiens, la concurrence entre les modèles est une bonne nouvelle: la qualité de génération s’améliore, les barrières à l’entrée diminuent et le choix d’outils s’élargit. Seedance 2.0 reste dans le top niveau pour la qualité visuelle, la physique des actions et le flux de travail créatif. Si vous voulez découvrir les capacités les plus récentes de la génération de vidéo par IA, vous pouvez commencer à l’utiliser dès maintenant.


Commencez avec Seedance 2.0

Related searches: Seedance 2.0, Seedance tutorial, Seedance Chinese version, AI video generation comparison, Gemini Omni.