Google เพิ่มความล้ำ Generative AI ของ Gemini ด้วยโมเดลสร้างดนตรี Lyria 3 เปิดให้ผู้ใช้งานทั่วไปสามารถสร้างสรรค์เพลงความยาว 30 วินาทีได้แบบรวดเร็วทันใจ ผ่านการป้อนพรอมต์ข้อความ รูปภาพ หรือวิดีโอ โดยเปิดให้ทดสอบเวอร์ชันเบต้าแล้ววันนี้
โมเดล Lyria 3 ได้รับการพัฒนาต่อยอดจากโมเดลรุ่นก่อนหน้า โดยมีจุดเด่นทั้งระบบสร้างเนื้อร้องอัตโนมัติ ให้อิสระในการปรับแต่งขั้นสูง สามารถกำหนดรายละเอียดเชิงลึก ทั้งแนวเพลง สไตล์เสียงร้อง และจังหวะดนตรีได้อย่างเฉพาะเจาะจง พร้อมเพิ่มความสมจริงทางดนตรี
โดยฟีเจอร์การสร้างเพลงบน Gemini รองรับทั้งการแปลงข้อความเป็นเพลง (Text-to-Music) ที่ผู้ใช้สามารถระบุอารมณ์ แนวเพลง หรือเรื่องราวเฉพาะเจาะจงลงไปได้ และที่น่าสนใจคือระบบแปลงภาพหรือวิดีโอเป็นเพลง เพียงแค่อัปโหลดไฟล์มัลติมีเดีย (เช่น ภาพบรรยากาศการท่องเที่ยว) Gemini ก็จะตีความบริบทเหล่านั้นและสร้างเป็นเพลงประกอบที่เข้ากับอารมณ์ของภาพได้อย่างลงตัว
นอกจากตัวเพลงความยาว 30 วินาที ยังจะได้รับภาพปก ที่ดึงความสามารถของโมเดลสร้างภาพ Nano Banana มาออกแบบให้โดยอัตโนมัติ เพื่อความสะดวกในการดาวน์โหลดหรือส่งลิงก์แชร์ต่อให้ผู้อื่น
เทคโนโลยี Lyria 3 ยังถูกนำไปขยายการรองรับในฟีเจอร์ Dream Track บน YouTube เพื่อให้เหล่าครีเอเตอร์สามารถสร้างซาวด์แทร็กสำหรับคลิป Shorts ได้อย่างโดดเด่นและไม่ซ้ำใคร โดยทุกเพลงที่สร้างขึ้นมา จะถูกฝังลายน้ำดิจิทัล SynthID เพื่อยืนยันว่าเป็นเนื้อหาที่สร้างจาก AI
นอกจากนี้ Google ยังได้เปิดตัวเครื่องมือตรวจสอบไฟล์เสียงภายในแอป Gemini ให้ผู้ใช้สามารถอัปโหลดไฟล์เสียงเข้ามาเพื่อเช็กได้ว่าถูกสร้างโดย AI ของ Google หรือไม่ พร้อมแสดงเหตุผลประกอบ
ทั้งนี้ ระบบของ Lyria 3 ถูกออกแบบมาเพื่อการสร้างสรรค์สิ่งใหม่ ไม่ใช่การโคลนนิ่งศิลปิน หากมีการระบุชื่อศิลปินในพรอมต์ ระบบจะดึงเพียงสไตล์หรือบรรยากาศมาเป็นแรงบันดาลใจเท่านั้น พร้อมมีตัวกรองป้องกันการสร้างผลงานซ้ำซ้อนกับเพลงที่มีลิขสิทธิ์อยู่เดิม
ฟีเจอร์ Lyria 3 บนแอป Gemini เปิดให้บริการแล้วในเวอร์ชันเบต้าสำหรับผู้ใช้ที่มีอายุ 18 ปีขึ้นไป โดยเริ่มเปิดให้ใช้งานบนเวอร์ชันเดสก์ท็อปตั้งแต่วันนี้ และอัปเดตให้ใช้งานบนมือถือในอนาคต รองรับ 8 ภาษา ได้แก่ อังกฤษ, เยอรมัน, สเปน, ฝรั่งเศส, ฮินดี, ญี่ปุ่น, เกาหลี และโปรตุเกส


