xs
xsm
sm
md
lg

Alibaba ออกโมเดลแปลงภาพเป็นวิดีโอ Wan2.2-S2V แจ้งเกิดชิป AI ตัวใหม่ลดพึ่งพา Nvidia

เผยแพร่:   ปรับปรุง:   โดย: ผู้จัดการออนไลน์



ยักษ์ใหญ่วงการเทคโนโลยีจีนอย่าง "อาลีบาบา" (Alibaba) เปิดตัวโมเดลโอเพ่นซอร์สใหม่ล่าสุด "Wan2.2-S2V" หรือ Speech-to-Video Model ความเก่งคือสามารถแปลงภาพถ่ายให้กลายเป็นวิดีโอมนุษย์ดิจิทัลได้ในท่าทางพูด ขยับปาก ร้องเพลง หรือแสดงท่าทางต่าง ๆ เสมือนจริงคุณภาพระดับภาพยนตร์ ตัวโมเดลรองรับได้หลายรูปแบบ ทั้งวิดีโอพอร์ตเทรต ครึ่งตัว หรือเต็มตัว แถมยังสร้างคอนเทนต์ได้ทั้งแนวโซเชียลสั้น ๆ ไปจนถึงงานโปรดักชันระดับทีวีและภาพยนตร์ เหมาะสำหรับครีเอเตอร์ที่อยากได้เครื่องมือสร้างอวาตาร์หรือคอนเทนต์เสมือนจริงแบบไม่ต้องพึ่งทีมโปรดักชันใหญ่ ๆ อีกต่อไป

Alibaba ไม่ได้หยุดแค่นี้ ล่าสุดบริษัทยังพัฒนาชิป AI ตัวใหม่ขึ้นมา เพื่อช่วยลดการพึ่งพา "เอ็นวิเดีย" (Nvidia) หลังจากที่ติดข้อจำกัดด้านกฎระเบียบการนำเข้าชิปขั้นสูงจากสหรัฐฯ ชิปตัวใหม่นี้ออกแบบมาเพื่อรองรับงาน "AI inference" หรือการประมวลผลเพื่อตอบสนอง AI หลังการเทรน ซึ่งถือว่ามีความต้องการสูงมากในจีน

***Alibaba เดินหน้าปั้นเครื่องมือ AI สำหรับครีเอเตอร์

เมื่อวันที่ 28 สิงหาคมที่ผ่านมา บริษัทยักษ์ใหญ่ Alibaba ได้เปิดตัวโมเดล AI ตัวใหม่ชื่อ Wan2.2-S2V ซึ่งย่อมาจาก Speech-to-Video นี่คือโมเดลโอเพ่นซอร์สที่สามารถแปลงภาพถ่ายบุคคลธรรมดาให้กลายเป็นวิดีโอ Digital Human ที่สามารถพูด ร้องเพลง และแสดงท่าทางได้อย่างสมจริง

Screenshot from Wan2.2-S2V Demo Video: Female Singer: https://youtu.be/9Nva0uRo6U8
ที่น่าตื่นเต้นคือ โมเดลนี้ใช้เพียงแค่ภาพถ่ายหนึ่งภาพกับไฟล์เสียงหนึ่งไฟล์ ก็สามารถสร้างวิดีโอคุณภาพระดับภาพยนตร์ได้แล้วครับ รองรับการสร้างวิดีโอได้หลายมุมมอง ทั้งแบบพอร์ตเทรต ครึ่งตัว และเต็มตัว ความละเอียดตั้งแต่ 480P ถึง 720P



Wan2.2-S2V ไม่ใช่แค่การสร้างภาพเคลื่อนไหวธรรมดา โมเดลนี้ใช้เทคโนโลยีการควบคุมการเคลื่อนไหวสองระดับ คือการควบคุมภาพรวมด้วยคำสั่งข้อความ และการเคลื่อนไหวรายละเอียดด้วยข้อมูลเสียง ทำให้ตัวละครเคลื่อนไหวได้อย่างเป็นธรรมชาติและสื่ออารมณ์ได้อย่างลึกซึ้ง

Alibaba ยังได้พัฒนาชิป AI ตัวใหม่เพื่อทดแทนชิป Nvidia ที่ถูกจำกัดการนำเข้าจากสหรัฐฯ
นวัตกรรมสำคัญอีกอย่างคือเทคนิคการประมวลผลเฟรมที่ช่วยลดต้นทุนการประมวลผลอย่างมาก โดยบีบอัดเฟรมยาวๆ ให้เป็นภาพแฝงขนาดกะทัดรัดเพียงภาพเดียว ทำให้สร้างวิดีโอยาวที่มีความเสถียรได้อย่างน่าทึ่ง

***สงคราม AI Chip ระหว่างจีน-สหรัฐฯ

ในอีกด้านหนึ่ง Alibaba ยังได้พัฒนาชิป AI ตัวใหม่เพื่อทดแทนชิป Nvidia ที่ถูกจำกัดการนำเข้าจากสหรัฐฯ

Alibaba ซึ่งเคยเป็นลูกค้าใหญ่ของ Nvidia ตอนนี้กำลังสร้างชิปทดแทนที่ออกแบบมาสำหรับงาน AI inference โดยเฉพาะ ความพิเศษของชิปตัวนี้คือสามารถทำงานร่วมกับแพลตฟอร์ม Nvidia ได้ ทำให้วิศวกรสามารถใช้โปรแกรมที่เขียนไว้สำหรับ Nvidia ได้โดยไม่ต้องเปลี่ยนแปลง

 Alibaba จะลงทุนอย่างน้อย 53,000 ล้านดอลลาร์สหรัฐในสาขา AI ในช่วงสามปีข้างหน้า
ปัจจุบัน ตลาด AI ของจีนกำลังเติบโต ข้อมูลจากไตรมาสที่สองของปี 2568 แสดงให้เห็นว่ารายได้จากบริการคลาวด์ของ Alibaba เติบโต 26% จากความต้องการบริการ AI ที่เพิ่มขึ้นอย่างรวดเร็ว โดยซีอีโอ Eddie Wu ได้กล่าวว่า "AI plus Cloud" เป็นหนึ่งในสองเครื่องยนต์การเติบโตหลักของบริษัท โดย Alibaba จะลงทุนอย่างน้อย 53,000 ล้านดอลลาร์สหรัฐในสาขานี้ในช่วงสามปีข้างหน้า

ผลลัพท์ต่ออุตสาหกรรมจากการเปิดตัว Wan2.2-S2V พร้อมชิป AI ตัวใหม่นี้ แสดงให้เห็นถึงความมุ่งมั่นของจีนในการสร้างเทคโนโลยี AI ที่พึ่งพาตนเองได้ ซึ่งจะส่งผลกระทบต่อตลาด AI ทั้งในจีนและทั่วโลก สำหรับครีเอเตอร์และนักพัฒนาคอนเทนต์ Wan2.2-S2V จะเปิดโอกาสใหม่ในการสร้างคอนเทนต์ Digital Human ที่มีคุณภาพสูงด้วยต้นทุนที่ต่ำลง โมเดลนี้พร้อมให้ดาวน์โหลดแล้วบน Hugging Face, GitHub และ ModelScope

นี่คือการแข่งขันที่ดุเดือดในวงการ AI ระหว่างสองมหาอำนาจโลก ซึ่งจะส่งผลต่อทิศทางการพัฒนาเทคโนโลยี AI ในอนาคตแน่นอน.
กำลังโหลดความคิดเห็น