คู่แข่งที่แข็งแกร่งที่สุดของ Seedance 2.0 ปรากฏตัวแล้ว

เมื่อเร็ว ๆ นี้ มีข่าวใหญ่ในวงการสร้างวิดีโอด้วย AI โดย Google ถูกรายงานว่ากำลังทดสอบโมเดลสร้างวิดีโอใหม่ที่ใช้ชื่อรหัส Gemini Omni และผู้ใช้คนหนึ่งได้เผลียงเข้าถึงการทดสอบภายในแอป Gemini จากผลการทดสอบที่รั่วไหล Gemini Omni มีประสิทธิภาพที่น่าประทับใจในหลายสถานการณ์สำคัญ และอาจเป็นคู่แข่งที่แข็งแกร่งที่สุดของ Seedance 2.0 เท่าที่เคยเจอมา
Gemini Omni คืออะไร
ตามภาพหน้าจอที่รั่วไหล Gemini Omni ถูกอธิบายว่าเป็น “โมเดลสร้างวิดีโอใหม่” ของ Google โดยรองรับไม่เพียงแต่การสร้างวิดีโอจากศูนย์ แต่ยังรวมถึงการรีมิกซ์วิดีโอ การแก้ไขแบบสนทนา และการสร้างจากเทมเพลต พูดง่าย ๆ คือ แทนที่จะเป็นแค่ “สร้างคลิปวิดีโอ” มันต้องการให้ผู้ใช้สามารถแก้ไขเนื้อหาวิดีโอผ่านการโต้ตอบแบบแชทได้
อย่างไรก็ตาม Google ยังไม่ได้เปิดตัวอย่างเป็นทางการ และสิทธิ์การเข้าถึงการทดสอบที่รั่วไหลถูกเพิกถอนอย่างรวดเร็ว ดังนั้นการเปรียบเทียบต่อไปนี้จึงอิงจากคลิปทดสอบที่ปรากฏบนโซเชียลมีเดียเป็นหลัก
การทดสอบที่ 1: การแสดงผลข้อความบนกระดานคณิตศาสตร์ที่ซับซ้อน
ปัญหาที่คาราค่อมข้างยาวนานในการสร้างวิดีโอ AI คือความสอดคล้องของข้อความ หลายโมเดลสร้างกระดานหรือกระดาษที่มีข้อความยุ่งเหยิง หรือตัวอักษรไม่ตรงกันระหว่างช็อต
ในการทดสอบที่รั่วไหล มีคนใช้คำสั่งเพียงประโยคเดียวเพื่อสร้างวิดีโอ 10 วินาทีด้วย Gemini Omni: ศาสตราจารย์เขียนการพิสูจน์เอกลักษณ์ตรีโกณมิติบนกระดานและอธิบายขั้นตอนปัจจุบัน
ผลลัพธ์แสดงให้เห็นว่าสูตรคณิตศาสตร์บนกระดานโดยทั่วไปอ่านได้ และค่อนข้างคงที่ตลอดการเคลื่อนไหวของกล้อง แม้ว่าการตรวจสอบอย่างใกล้ชิดจะเผยให้เห็นสัญลักษณ์ AI บ้าง แต่การปรับปรุงจากโมเดลก่อนหน้าชัดเจน
เพื่อการเปรียบเทียบที่เป็นธรรม เราได้ป้อนคำสั่งเดียวกันให้กับ Seedance 2.0 Seedance 2.0 ยังคงเชี่ยวชาญในเรื่องความสมจริงของภาพและแสง แต่ความแม่นยำทางคณิตศาสตร์ของเนื้อหาบนกระดานคลาดเคลื่อนเล็กน้อย และการแสดงผลข้อความบางส่วนยังคงเบลอ
| รายการเปรียบเทียบ | Gemini Omni (เวอร์ชันรั่ว) | Seedance 2.0 |
|---|---|---|
| ความสมจริงของภาพ | ยอดเยี่ยม | ยอดเยี่ยม |
| ความอ่านง่ายของข้อความ | ดี สูตรค่อนข้างอ่านได้ | ปานกลาง ข้อความบางส่วนเบลอ |
| ความเสถียรของกล้อง | คงที่ | คงที่ |
การทดสอบนี้แสดงให้เห็นว่า การแสดงผลข้อความ กำลังเป็นสนามรบใหม่ระหว่างโมเดลชั้นนำ สำหรับวิดีโอการสอนที่ต้องแสดงข้อความ สูตร หรือการทำงานของอินเทอร์เฟซ ความสามารถนี้มีความสำคัญอย่างยิ่ง
การทดสอบที่ 2: “Will Smith กินสปาเก็ตตี้”
คำสั่งนี้กลายเป็นมาตรฐานเปรียบเทียบสำหรับเกือบทุกโมเดลสร้างวิดีโอ การทดสอบมุ่งเน้นไปที่ว่าการเคลื่อนไหวของตัวละครเป็นธรรมชาติหรือไม่ ฟิสิกส์ของวัตถุถูกต้องหรือไม่ และกระบวนการกินสอดคล้องกันหรือไม่
ในเวอร์ชันที่ Gemini Omni สร้าง รูปลักษณ์ของตัวละครและบรรยากาศของฉากค่อนข้างสมจริง อย่างไรก็ตาม ผู้ชมบางคนสังเกตเห็นปัญหาในรายละเอียด: ไม่มีสปาเก็ตตี้บนจานก่อนที่ตัวละครจะนั่งลง แต่ปรากฏขึ้นหลังจากนั่ง แล้วระหว่างกิน เส้นพาสต้าก็หายไปอย่างไม่มีเหตุผล สิ่งนี้บ่งชี้ว่าโมเดลยังคงมีช่องว่างใน ตรรกะฟิสิกส์แบบลูกโซ่ยาว
เราป้อนคำสั่งซับซ้อมเดียวกันเข้าไปใน Seedance 2.0 ในแง่ของความเป็นธรรมชาติของการกระทำการกิน Seedance 2.0 ทำงานได้ราบรื่นกว่า จังหวะการเคี้ยว การเคลื่อนไหวของมือ และการโต้ตอบกับอาหารสอดคล้องกับฟิสิกส์ของโลกจริงมากกว่า
| รายการเปรียบเทียบ | Gemini Omni (เวอร์ชันรั่ว) | Seedance 2.0 |
|---|---|---|
| รูปลักษณ์ของตัวละคร | สมจริง | สมจริง |
| บรรยากาศของฉาก | บรรยากาศร้านอาหารหรูหรา | แสงและพื้นผิวยอดเยี่ยม |
| ความสอดคล้องของการกระทำการกิน | ไม่ต่อเนื่อง ฟิสิกส์ต้องปรับปรุง | เป็นธรรมชาติมากกว่า ลำดับการกระทำสมบูรณ์ |
ในรอบนี้ Seedance 2.0 มีความได้เปรียบในเรื่องฟิสิกส์ของการกระทำและความสอดคล้องทางตรรกะ
ความสามารถในการแก้ไขวิดีโอของ Gemini Omni
นอกเหนือจากการสร้าง Gemini Omni ยังแสดง ความสามารถในการแก้ไขวิดีโอ ที่น่าประทับใจ เช่น:
- แทนที่สปาเก็ตตี้ในวิดีโอด้วยชามต้มยำกุ้งไทย
- ลบลายน้ำ Sora ออกจากวิดีโอโดยรักษาความสม่ำเสมอของภาพ
หากความสามารถนี้ยังคงอยู่เมื่อเปิดตัวอย่างเป็นทางการ คุณค่าทางปฏิบัติจะยิ่งใหญ่มาก ปัจจุบันเครื่องมือวิดีโอ AI ส่วนใหญ่ทำให้การแก้ไขขั้นที่สองหลังการสร้างเป็นเรื่องยาก แนวทาง “การแก้ไขแบบสนทนา” ของ Gemini Omni อาจเปลี่ยนสถานะนี้ได้
วิดีโอ AI กำลังกลายเป็นกระแสหลัก
ไม่ว่าประสิทธิภาพสุดท้ายของ Gemini Omni จะเป็นอย่างไร มีแนวโน้มหนึ่งที่ชัดเจน: คุณภาพของวิดีโอ AI กำลังเข้าใกล้มาตรฐานการผลิตระดับมืออาชีพอย่างรวดเร็ว
เมื่อเร็ว ๆ นี้ คลิปสั้นหลายชิ้นที่สร้างด้วย Seedance 2.0 ได้รับความสนใจมหาศาลบนแพลตฟอร์มโซเชียล ตัวอย่างเช่น คลิป AI สั้นที่ถูกขนานนามว่า “Love, Death & Robots ของจีน” ถูกสร้างโดยผู้สร้างในเพียง 10 วัน และได้รับข้อเสนอการร่วมมือจากบริษัทภาพยนตร์แล้ว วิดีโอนกพิราบที่ศิลปินเทคนิคของ Runway Marko Slavnic สร้างโดยใช้ Seedance 2.0 สะสมผู้เข้าชมหลายล้านครั้งในเวลาอันสั้น โดยมีคอมเมนต์มากมายบอกว่า “ดูไม่ออกเลยว่าเป็น AI”
กรณีเหล่านี้แสดงให้เห็นว่าวิดีโอ AI ไม่ใช่ของเล่นอีกต่อไป—มันกำลังกลายเป็นเครื่องมือสร้างสรรค์ที่แท้จริง
ความคิดสุดท้าย
การรั่วไหลโดยไม่ตั้งใจของ Gemini Omni ได้เพิ่มเชื้อไฟให้กับการแข่งขันสร้างวิดีโอ AI Google อาจเปิดตัวอย่างเป็นทางการในงาน I/O สัปดาห์หน้า และประสิทธิภาพในโลกของมันคุ้มค่าที่จะติดตาม
สำหรับผู้ใช้ทั่วไป การแข่งขันระหว่างโมเดลเป็นข่าวดี—คุณภาพการสร้างกำลังดีขึ้น อุปสรรคในการเข้าถึงกำลังลดลง และมีเครื่องมือให้เลือกมากขึ้น Seedance 2.0 ยังคงอยู่ในระดับสูงสุดในด้านคุณภาพภาพ ฟิสิกส์ของการกระทำ และขั้นตอนการสร้างสรรค์ หากคุณต้องการสัมผัสความสามารถล้ำสมัยในการสร้างวิดีโอ AI คุณสามารถเริ่มต้นได้ทันที
Related searches: Seedance 2.0, Seedance tutorial, Seedance Chinese version, AI video generation comparison, Gemini Omni.