Seedance Logo Seedance
Blogg

Seedance 2.0:s starkaste rival har dykt upp

Seedance

Seedance 2.0:s starkaste rival har dykt upp

Nyligen kom ett stort nytt i AI-videogenereringsvärlden. Google uppges testa en helt ny videgenereringsmodell med kodnamnet Gemini Omni, och en användare fick oavsiktligt tillgång till den i Gemini-appen. Baserat på de läckta testresultaten presterar Gemini Omni anmärkningsvärt väl i flera nyckelscenarier och kan vara den starkaste konkurrent som Seedance 2.0 hittills har stött på.

Vad är Gemini Omni

Enligt läckta skärmdumpar beskrivs Gemini Omni som Googles “nya videgenereringsmodell”. Den stöder inte bara generering av videor från grunden utan även videoremix, konversationsredigering och mallbaserad skapelse. Kort sagt, dess mål är inte bara “generera en video” utan att låta användare modifiera videoinnehåll genom chattliknande interaktioner.

Google har dock ännu inte släppt produkten officiellt, och den läckta teståtkomsten återkallades snabbt. Så den följande jämförande analysen baseras huvudsakligen på testklipp som har dykt upp online.

Test 1: Komplext matematik-tavla textrendering

Ett långvarigt problem inom AI-videogenerering är textkoherens. Många modeller producerar tavlor eller pappersark med förvrängd text, eller så matchar skrivningen inte mellan olika tagningar.

I det läckta testet använde någon en mening lång prompt för att generera en 10 sekunders video med Gemini Omni: en professor skriver ett bevis för en trigonometrisk identitet på en tavla och förklarar det aktuella steget.

Resultatet visade att de matematiska formlerna på tavlan generellt var läsbara och förblev relativt stabila genom kamerarörelsen. Även om noggrann inspektion fortfarande avslöjar vissa AI-artefakter är förbättringen jämfört med tidigare modeller tydlig.

För en rättvis jämförelse gav vi samma prompt till Seedance 2.0. Seedance 2.0 excellerar fortfarande i fotorealism och belysning, men den matematiska noggrannheten i tavlinnehållet var något avvikande, med viss text som fortfarande var oskarp.

JämförelsepunktGemini Omni (läckt)Seedance 2.0
Visuell realismUtmärktUtmärkt
TextläsbarhetBra, formler mestadels läsbaraMedelmåttig, viss text oskarp
KamerastabilitetStabilStabil

Detta test visar att textrendering håller på att bli en ny stridsplats bland toppmodeller. För instruktionsvideor som behöver visa text, formler eller gränssnittsoperationer är denna förmåga särskilt avgörande.

Test 2: “Will Smith äter spaghetti”

Denna prompt har blivit en standardmätare för nästan varje videgenereringsmodell. Testet fokuserar på huruvida karaktärsrörelser är naturliga, huruvida objektsfysiken är korrekt, och huruvida ätprocessen är sammanhängande.

I den av Gemini Omni genererade versionen var karaktärsutseendet och scenens atmosfär ganska realistiska. Men vissa tittare märkte ett detaljproblem: det fanns ingen spaghetti på tallriken innan karaktären satte sig, men den dök upp efter att ha satt sig; sedan under ätandet försvann nudlarna oförklarligt. Detta indikerar att modellen fortfarande har luckor i långkedjig fysiklogik.

Vi matade in samma komplexa prompt i Seedance 2.0. När det gäller naturlig ätrörelse presterade Seedance 2.0 smidigare. Tuggtrytmen, handrörelserna och matinteraktionen var mer förenliga med verklig fysik.

JämförelsepunktGemini Omni (läckt)Seedance 2.0
KaraktärsutseendeFotorealistisktFotorealistiskt
ScenatmosfärStark lyxig restaurangkänslaUtmärkt ljus och textur
ÄtrörelsesammanhangInkonsekvent, fysik behöver arbeteMer naturligt, komplett rörelsekedja

I denna omgång tog Seedance 2.0 ledningen inom rörelsefysik och logisk koherens.

Gemini Omnis videoredigeringsmöjligheter

Bortsett från generering demonstrerade Gemini Omni också förvånansvärt videoredigerings förmågor. Till exempel:

  • Ersätt pastan i en video direkt med en skål thailändsk tom yum-soppa;
  • Ta bort ett Sora-vattenmärke från en video samtidigt som footage förblir konsekvent.

Om denna förmåga bibehålls vid den officiella lanseringen kommer dess praktiska värde att vara enormt. För närvarande gör de flesta AI-videoverktyg sekundär redigering svår efter generering. Gemini Omnis “konversationsredigerings”-metod kan förändra detta status quo.

AI-video blir mainstream

Oavsett Gemini Omnis slutliga prestanda är en trend tydlig: kvaliteten på AI-video närmar sig snabbt professionella produktionsstandarder.

Nyligen har flera kortfilmer skapade med Seedance 2.0 fått massiv uppmärksamhet på sociala plattformar. Till exempel blev en AI-kortfilm med smeknamnet “Kinas Love, Death & Robots” färdig av sin skapare på bara 10 dagar och har redan fått samarbetserbjudanden från filmstudior. En duvvideo gjord av Runway tekniska konstnär Marko Slavnic med Seedance 2.0 fick miljontals visningar på kort tid, med många kommentarer som sa “man kunde inte alls se att det var AI”.

Dessa fall visar att AI-video inte längre är en leksak - det håller på att bli ett riktigt kreativt verktyg.

Avslutande tankar

Den oavsiktliga läckan av Gemini Omni har lagt mer bränsle i AI-videogenereringsracen. Google kan officiellt tillkännage produkten på nästa veckas I/O-konferens, och dess verkliga prestanda är värd att bevaka.

För vanliga användare är konkurrens mellan modeller goda nyheter - genereringskvaliteten förbättras, inträdesbarriärerna sjunker och valet av verktyg ökar. Seedance 2.0 förblir i toppklassen för visuell kvalitet, rörelsefysik och kreativa arbetsflöden. Om du vill uppleva den nuvarande toppmoderna AI-videogenereringen kan du börja nu.


Kom igång med Seedance 2.0

Relaterade sökningar: Seedance 2.0, Seedance handledning, Seedance kinesiska version, AI videogenereringsjämförelse, Gemini Omni.