ยักษ์ใหญ่วงการเทคโนโลยีจีนอย่าง "อาลีบาบา" (Alibaba) เปิดตัวโมเดลโอเพ่นซอร์สใหม่ล่าสุด "Wan2.2-S2V" หรือ Speech-to-Video Model ความเก่งคือสามารถแปลงภาพถ่ายให้กลายเป็นวิดีโอมนุษย์ดิจิทัลได้ในท่าทางพูด ขยับปาก ร้องเพลง หรือแสดงท่าทางต่าง ๆ เสมือนจริงคุณภาพระดับภาพยนตร์ ตัวโมเดลรองรับได้หลายรูปแบบ ทั้งวิดีโอพอร์ตเทรต ครึ่งตัว หรือเต็มตัว แถมยังสร้างคอนเทนต์ได้ทั้งแนวโซเชียลสั้น ๆ ไปจนถึงงานโปรดักชันระดับทีวีและภาพยนตร์ เหมาะสำหรับครีเอเตอร์ที่อยากได้เครื่องมือสร้างอวาตาร์หรือคอนเทนต์เสมือนจริงแบบไม่ต้องพึ่งทีมโปรดักชันใหญ่ ๆ อีกต่อไป
Alibaba ไม่ได้หยุดแค่นี้ ล่าสุดบริษัทยังพัฒนาชิป AI ตัวใหม่ขึ้นมา เพื่อช่วยลดการพึ่งพา "เอ็นวิเดีย" (Nvidia) หลังจากที่ติดข้อจำกัดด้านกฎระเบียบการนำเข้าชิปขั้นสูงจากสหรัฐฯ ชิปตัวใหม่นี้ออกแบบมาเพื่อรองรับงาน "AI inference" หรือการประมวลผลเพื่อตอบสนอง AI หลังการเทรน ซึ่งถือว่ามีความต้องการสูงมากในจีน
***Alibaba เดินหน้าปั้นเครื่องมือ AI สำหรับครีเอเตอร์
เมื่อวันที่ 28 สิงหาคมที่ผ่านมา บริษัทยักษ์ใหญ่ Alibaba ได้เปิดตัวโมเดล AI ตัวใหม่ชื่อ Wan2.2-S2V ซึ่งย่อมาจาก Speech-to-Video นี่คือโมเดลโอเพ่นซอร์สที่สามารถแปลงภาพถ่ายบุคคลธรรมดาให้กลายเป็นวิดีโอ Digital Human ที่สามารถพูด ร้องเพลง และแสดงท่าทางได้อย่างสมจริง
ที่น่าตื่นเต้นคือ โมเดลนี้ใช้เพียงแค่ภาพถ่ายหนึ่งภาพกับไฟล์เสียงหนึ่งไฟล์ ก็สามารถสร้างวิดีโอคุณภาพระดับภาพยนตร์ได้แล้วครับ รองรับการสร้างวิดีโอได้หลายมุมมอง ทั้งแบบพอร์ตเทรต ครึ่งตัว และเต็มตัว ความละเอียดตั้งแต่ 480P ถึง 720P
Wan2.2-S2V ไม่ใช่แค่การสร้างภาพเคลื่อนไหวธรรมดา โมเดลนี้ใช้เทคโนโลยีการควบคุมการเคลื่อนไหวสองระดับ คือการควบคุมภาพรวมด้วยคำสั่งข้อความ และการเคลื่อนไหวรายละเอียดด้วยข้อมูลเสียง ทำให้ตัวละครเคลื่อนไหวได้อย่างเป็นธรรมชาติและสื่ออารมณ์ได้อย่างลึกซึ้ง
นวัตกรรมสำคัญอีกอย่างคือเทคนิคการประมวลผลเฟรมที่ช่วยลดต้นทุนการประมวลผลอย่างมาก โดยบีบอัดเฟรมยาวๆ ให้เป็นภาพแฝงขนาดกะทัดรัดเพียงภาพเดียว ทำให้สร้างวิดีโอยาวที่มีความเสถียรได้อย่างน่าทึ่ง
***สงคราม AI Chip ระหว่างจีน-สหรัฐฯ
ในอีกด้านหนึ่ง Alibaba ยังได้พัฒนาชิป AI ตัวใหม่เพื่อทดแทนชิป Nvidia ที่ถูกจำกัดการนำเข้าจากสหรัฐฯ
Alibaba ซึ่งเคยเป็นลูกค้าใหญ่ของ Nvidia ตอนนี้กำลังสร้างชิปทดแทนที่ออกแบบมาสำหรับงาน AI inference โดยเฉพาะ ความพิเศษของชิปตัวนี้คือสามารถทำงานร่วมกับแพลตฟอร์ม Nvidia ได้ ทำให้วิศวกรสามารถใช้โปรแกรมที่เขียนไว้สำหรับ Nvidia ได้โดยไม่ต้องเปลี่ยนแปลง
ปัจจุบัน ตลาด AI ของจีนกำลังเติบโต ข้อมูลจากไตรมาสที่สองของปี 2568 แสดงให้เห็นว่ารายได้จากบริการคลาวด์ของ Alibaba เติบโต 26% จากความต้องการบริการ AI ที่เพิ่มขึ้นอย่างรวดเร็ว โดยซีอีโอ Eddie Wu ได้กล่าวว่า "AI plus Cloud" เป็นหนึ่งในสองเครื่องยนต์การเติบโตหลักของบริษัท โดย Alibaba จะลงทุนอย่างน้อย 53,000 ล้านดอลลาร์สหรัฐในสาขานี้ในช่วงสามปีข้างหน้า
ผลลัพท์ต่ออุตสาหกรรมจากการเปิดตัว Wan2.2-S2V พร้อมชิป AI ตัวใหม่นี้ แสดงให้เห็นถึงความมุ่งมั่นของจีนในการสร้างเทคโนโลยี AI ที่พึ่งพาตนเองได้ ซึ่งจะส่งผลกระทบต่อตลาด AI ทั้งในจีนและทั่วโลก สำหรับครีเอเตอร์และนักพัฒนาคอนเทนต์ Wan2.2-S2V จะเปิดโอกาสใหม่ในการสร้างคอนเทนต์ Digital Human ที่มีคุณภาพสูงด้วยต้นทุนที่ต่ำลง โมเดลนี้พร้อมให้ดาวน์โหลดแล้วบน Hugging Face, GitHub และ ModelScope
นี่คือการแข่งขันที่ดุเดือดในวงการ AI ระหว่างสองมหาอำนาจโลก ซึ่งจะส่งผลต่อทิศทางการพัฒนาเทคโนโลยี AI ในอนาคตแน่นอน.