Google เปิดตัว VideoPoet เพิ่มมิติใหม่ให้กับการสร้าง วิดีโอ ที่ขับเคลื่อนด้วย AI สามารถสร้างคลิปวิดีโอความยาว 10 วินาที จากข้อความที่ระบุและยังสามารถทำให้ภาพนิ่งเคลื่อนไหวได้
Google เปิดตัว VideoPoet ซึ่งเป็นโมเดลภาษาขนาดใหญ่ (LLM) ที่สามารถสร้างคลิป 10 วินาทีได้ โมเดลดังกล่าวรองรับงานการสร้าง วิดีโอ ที่หลากหลาย รวมถึงการแปลงข้อความเป็นวิดีโอ การแปลงรูปภาพเป็นวิดีโอ การปรับแต่งสไตล์วิดีโอ การลงสี และฟังก์ชันวิดีโอเป็นเสียง
VideoPoet สามารถผลิตวิดีโอขนาดยาว 10 วินาที ยิ่งไปกว่านั้น VideoPoet ไม่ได้ใช้ข้อมูลเฉพาะสำหรับการสร้างวิดีโอ ทำให้มีความแตกต่างจากรุ่นอื่น ๆ ที่ต้องการอินพุตโดยละเอียดเพื่อให้ได้ผลลัพธ์ที่ดีที่สุด
VideoPoet ของ Google แตกต่างจากโมเดลการสร้างวิดีโอทั่วไป ซึ่งส่วนใหญ่อาศัยแนวทาง diffusion-based แต่ VideoPoet กลับใช้พลังของโมเดลภาษาขนาดใหญ่ (LLM) ในการผสานรวมงานเพื่อสร้างวิดีโอต่าง ๆ อย่างราบรื่นภายใน LLM เดียว
วิดีโอที่ได้จะแสดงความยาวที่แปรผัน รวมถึงการกระทำและสไตล์ที่หลากหลาย โดยอิงตามเนื้อหาข้อความที่ป้อนไว้ นอกจากนี้ VideoPoet ยังสามารถแปลงภาพที่อินพุตเป็นภาพเคลื่อนไหวตามคำแนะนำที่ให้ไว้ได้อีกด้วย แสดงให้เห็นถึงความสามารถในการปรับตัวตามอินพุตต่าง ๆ
อ้างอิง Gizmochina