Google เปิดตัว VideoPoet ก้าวใหม่ในการสร้าง วิดีโอ เพียงระบุสิ่งที่ต้องการ

22 ธันวาคม 2023

Google เปิดตัว VideoPoet เพิ่มมิติใหม่ให้กับการสร้าง วิดีโอ ที่ขับเคลื่อนด้วย AI สามารถสร้างคลิปวิดีโอความยาว 10 วินาที จากข้อความที่ระบุและยังสามารถทำให้ภาพนิ่งเคลื่อนไหวได้

Google เปิดตัว VideoPoet ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่สามารถสร้างคลิป 10 วินาทีได้ โมเดลดังกล่าวรองรับงานการสร้าง วิดีโอ ที่หลากหลาย รวมถึงการแปลงข้อความเป็นวิดีโอ การแปลงรูปภาพเป็นวิดีโอ การปรับแต่งสไตล์วิดีโอ การลงสี และฟังก์ชันวิดีโอเป็นเสียง

VideoPoet สามารถผลิตวิดีโอขนาดยาว 10 วินาที ยิ่งไปกว่านั้น VideoPoet ไม่ได้ใช้ข้อมูลเฉพาะสำหรับการสร้างวิดีโอ ทำให้มีความแตกต่างจากรุ่นอื่น ๆ ที่ต้องการอินพุตโดยละเอียดเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด

VideoPoet ของ Google แตกต่างจากโมเดลการสร้างวิดีโอทั่วไป ซึ่งส่วนใหญ่อาศัยแนวทาง diffusion-based แต่ VideoPoet กลับใช้พลังของโมเดลภาษาขนาดใหญ่ (LLM) ในการผสานรวมงานเพื่อสร้างวิดีโอต่าง ๆ อย่างราบรื่นภายใน LLM เดียว

วิดีโอที่ได้จะแสดงความยาวที่แปรผัน รวมถึงการกระทำและสไตล์ที่หลากหลาย โดยอิงตามเนื้อหาข้อความที่ป้อนไว้ นอกจากนี้ VideoPoet ยังสามารถแปลงภาพที่อินพุตเป็นภาพเคลื่อนไหวตามคำแนะนำที่ให้ไว้ได้อีกด้วย แสดงให้เห็นถึงความสามารถในการปรับตัวตามอินพุตต่าง ๆ

อ้างอิง Gizmochina