Seedance Logo Seedance
Blog

È apparso il rivale più forte di Seedance 2.0

Seedance

È apparso il rivale più forte di Seedance 2.0

Recentemente, il settore della generazione di video AI è stato colpito da una grande fuga di notizie. Google sta testando un nuovo modello di generazione video con nome in codice Gemini Omni, e un utente ha accidentalmente attivato l’accesso all’interno dell’app Gemini. Secondo i risultati dei test trapelati, Gemini Omni funziona remarkably bene in diversi scenari chiave e potrebbe essere il rivale più forte che Seedance 2.0 abbia mai affrontato.

Cos’è Gemini Omni

Secondo gli screenshot trapelati, Gemini Omni è descritto come il “nuovo modello di generazione video” di Google. Supporta non solo la generazione di video da zero, ma anche il remix video, la modifica conversazionale e la creazione basata su modelli. In breve, l’obiettivo è permettere agli utenti di modificare i contenuti video attraverso interazioni simili a una chat, non solo “generare un clip”.

Tuttavia, Google non ha ancora rilasciato ufficialmente il prodotto e l’accesso ai test trapelato è stato rapidamente revocato. Quindi il confronto seguente si basa principalmente sui clip di test apparsi online.

Test 1: Rendering del testo della lavagna matematica complessa

Un problema di lunga data nella generazione di video AI è la coerenza del testo. Molti modelli producono lavagne o fogli di carta con testo confuso, oppure la scrittura non corrisponde tra le inquadrature.

Nel test trapelato, qualcuno ha usato un prompt di una singola frase per generare un video di 10 secondi con Gemini Omni: un professore scrive una dimostrazione di identità trigonometrica sulla lavagna e spiega il passaggio corrente.

I risultati hanno mostrato che le formule matematiche sulla lavagna erano generalmente leggibili e sono rimaste relativamente stabili durante il movimento della telecamera. Sebbene un’ispezione attenta riveli ancora alcuni artefatti AI, il miglioramento rispetto ai modelli precedenti è chiaro.

Per un confronto equo, abbiamo fornito lo stesso prompt a Seedance 2.0. Seedance 2.0 eccelle ancora nel fotorealismo e nell’illuminazione, ma l’accuratezza matematica del contenuto sulla lavagna era leggermente errata, e alcuni rendering di testo erano ancora sfocati.

Voce di confrontoGemini Omni (Versione trapelata)Seedance 2.0
Realismo visivoEccellenteEccellente
Leggibilità del testoBuona, formule mostly leggibiliMedia, parte del testo sfocato
Stabilità della telecameraStabileStabile

Questo test mostra che il rendering del testo sta diventando un nuovo campo di battaglia tra i modelli di fascia alta. Per i video formativi che devono mostrare testo, formule o operazioni dell’interfaccia, questa capacità è particolarmente critica.

Test 2: “Will Smith mangia gli spaghetti”

Questo prompt è diventato un benchmark standard per quasi ogni modello di generazione video. Il test si concentra su se i movimenti del personaggio sono naturali, se la fisica degli oggetti è corretta e se il processo di alimentazione è coerente.

Nella versione generata da Gemini Omni, l’aspetto del personaggio e l’atmosfera della scena erano piuttosto realistici. Tuttavia, alcuni spettatori hanno notato un problema di dettaglio: non c’erano spaghetti sul piatto prima che il personaggio si sedesse, ma sono apparsi dopo essersi seduto; poi, durante la masticazione, i noodles sono scomparsi inspiegabilmente. Questo indica che il modello ha ancora lacune nella logica fisica a catena lunga.

Abbiamo inserito lo stesso prompt complesso in Seedance 2.0. In termini di naturalezza dell’azione di mangiare, Seedance 2.0 ha performato in modo più fluido. Il ritmo della masticazione, i movimenti delle mani e l’interazione con il cibo erano più coerenti con la fisica del mondo reale.

Voce di confrontoGemini Omni (Versione trapelata)Seedance 2.0
Aspetto del personaggioFotorealisticoFotorealistico
Atmosfera della scenaForte sensazione di ristorante di lussoEccellente illuminazione e texture
Coerenza dell’azione di alimentazioneDiscontinua, fisica da migliorarePiù naturale, catena di azioni completa

In questo round, Seedance 2.0 ha avuto la meglio sulla fisica delle azioni e sulla coerenza logica.

Capacità di modifica video di Gemini Omni

Oltre alla generazione, Gemini Omni ha anche dimostrato sorprendenti capacità di modifica video. Ad esempio:

  • Sostituire gli spaghetti in un video direttamente con una ciotola di zuppa tom yum thailandese;
  • Rimuovere un watermark Sora da un video mantenendo la coerenza delle riprese.

Se questa capacità rimane intatta al lancio ufficiale, il suo valore pratico sarà enorme. Attualmente, la maggior parte degli strumenti video AI rende difficile la modifica secondaria dopo la generazione. L’approccio di “modifica conversazionale” di Gemini Omni potrebbe cambiare questo status quo.

I video AI stanno diventando mainstream

Indipendentemente dalle prestazioni finali di Gemini Omni, una tendenza è chiara: la qualità dei video AI si sta avvicinando rapidamente agli standard di produzione professionale.

Recentemente, diversi cortometraggi creati con Seedance 2.0 hanno guadagnato massive attenzione sulle piattaforme social. Ad esempio, un cortometraggio AI soprannominato “Il Love, Death & Robots della Cina” è stato completato dal suo creatore in soli 10 giorni e ha già ricevuto offerte di collaborazione da case cinematografiche. Un video di piccione realizzato dall’artista tecnico di Runway Marko Slavnic usando Seedance 2.0 ha raccolto milioni di visualizzazioni in breve tempo, con molti commentatori che dicevano che “non si poteva proprio dire che fosse AI”.

Questi casi mostrano che i video AI non sono più giocattoli—stanno diventando un vero strumento creativo.

Pensieri finali

La fuga di notizie accidentale di Gemini Omni ha aggiunto più carburante alla corsa della generazione di video AI. Google potrebbe presentare ufficialmente il prodotto alla conferenza I/O della prossima settimana, e le sue prestazioni nel mondo reale varranno la pena di essere osservate.

Per gli utenti comuni, la concorrenza tra i modelli è una buona notizia: la qualità della generazione sta migliorando, le barriere d’ingresso stanno diminuendo e la scelta di strumenti sta aumentando. Seedance 2.0 rimane nella top tier per qualità visiva, fisica delle azioni e workflow creativo. Se vuoi provare l’attuale generazione video AI all’avanguardia, puoi iniziare subito.


Inizia con Seedance 2.0

Related searches: Seedance 2.0, Seedance tutorial, Seedance Chinese version, AI video generation comparison, Gemini Omni.