xs
xsm
sm
md
lg

มนุษย์มีหนาว! กูเกิล วิจัยผลิต “เสียงสังเคราะห์” เลียนแบบ “เสียงผู้หญิง” สำเร็จแล้ว

เผยแพร่:   ปรับปรุง:   โดย: ผู้จัดการออนไลน์


MGR Online - กูเกิลพัฒนาระบบแปลงข้อความเป็นเสียงในชื่อ “ทาโกทรอน 2” เลียนเสียงมนุษย์ผู้หญิงสำเร็จ และมีความแม่นยำจนแยกเสียงหุ่นยนต์กับเสียงคนไม่ออก เตรียมนำมาใช้ในระบบช่วยเหลือของกูเกิล (Google Assistant)

เมื่อวันที่ 26 ธันวาคม 2560 เว็บไซต์ข่าวเทคโนโลยี Quartz รายงานว่า ในบทความวิจัยที่เผยแพร่โดยกูเกิลล่าสุดเดือนนี้ ทว่ายังไม่มีการพิชญพิจารณ์ (ตรวจทานจากผู้เชี่ยวชาญ; peer review) เปิดเผยว่าระบบแปลงข้อความเป็นเสียง (text-to-speech) ที่ชื่อว่า ทาโกทรอน 2 (Tacotron 2) ซึ่งผู้พัฒนาอ้างว่าสามารถอ่านข้อความ และเลียนแบบเสียงมนุษย์พูดได้แม่นยำมาก
ระบบทาโกทรอน 2 ถือเป็นระบบแปลงข้อความเป็นเสียงรุ่นที่ 2 อย่างเป็นทางการของกูเกิล ซึ่งผนวกเอาโครงข่ายประสาทเทียมระดับลึก (Deep Neural Networks) สองโครงข่าวเข้าด้วยกัน โดยโครงข่ายแรกจะแปลข้อความไปเป็น กราฟคลื่นเสียง (Spectrogram) จากนั้น กราฟคลื่นเสียงดังกล่าวจะถูกส่งต่อไปยัง เวฟเน็ต (Wavenet) หรือระบบจากห้องทดลองดีพมายด์ ซึ่งเป็นศูนย์วิจัยปัญญาประดิษฐ์ของอัลฟาเบต บริษัทแม่ของกูเกิล ซึ่งเวฟเน็ตจะอ่านกราฟ และสังเคราะห์เสียงออกมาตามกราฟดังกล่าว

จากตัวอย่างเสียงซึ่งเว็บไซต์ Quartz นำมาให้ผู้อ่านได้ฟัง ประกอบไปด้วยประโยค
1. “George Washington was the first President of the United States.”
2. “That girl did a video about Star Wars lipstick.”

คลิกไปยังเว็บไซต์เพื่อฟังเสียงตัวอย่าง >> Google’s voice-generating AI is now indistinguishable from humans

ประโยคทั้งสองมีเสียงหนึ่งที่อ่านโดยมนุษย์ และอีกเสียงหนึ่งที่อ่านโดยปัญญาประดิษฐ์ จะพบว่าแทบจะไม่มีความแตกต่างเลยทีเดียว นอกจากนี้ นักวิจัยของกูเกิลยังทดสอบให้เห็นด้วยว่า ทาโกทรอน 2 สามารถออกเสียงคำ และชื่อ ที่ออกเสียงยากได้อย่างไม่มีปัญหา รวมไปถึงคำเน้นคำย้ำต่าง ๆ ในประโยคที่มนุษย์พูดกันในชีวิตประจำวันก็สามารถทำได้ดี

สำหรับเทคโนโลยีดังกล่าวนี้ กูเกิลสามารถนำไปใช้งานได้ทันทีใน กูเกิล แอสซิสแทนต์ (Google Assistant) โดยประสิทธิภาพของทาโกทรอน 2 นั้นจะดีขึ้นเรื่อย ๆ เมื่อเวลาผ่านไป อย่างไรก็ตาม ณ วันนี้ระบบเลียนเสียงมนุษย์ดังกล่าวยังมีข้อจำกัด คือ สามารถเลียนเสียงผู้หญิงได้คนเดียวเท่านั้น หากต้องการให้ระบบออกเสียงเป็นเสียงผู้ชาย หรือผู้หญิงคนอื่น ก็จะต้องมีการฝึกระบบใหม่อีกครั้งหนึ่ง
กำลังโหลดความคิดเห็น