แม้หลายคนจะไม่ชอบใจกับบริการ “คอลเซ็นเตอร์” ที่ติดต่อมาขายประกัน แต่ธุรกิจนี้ก็เติบโตไปด้วยสวย แต่การจะขยายธุรกิจให้โตขึ้นต้องได้ใจลูกค้าส่วนหนึ่ง การปรับปรุงคุณภาพผู้ให้บริการที่ปลายสายจึงเป็นอีกส่วนสำคัญ แต่คงเป็นเรื่องยากที่จะเฝ้าฟังทุกการสนทนาระหว่างลูกค้าและการให้บริการ “พาที” แอปพลิเคชันแปลงเสียงเป็นข้อความผลงานไทยจึงเป็นอีกทางแก้ปัญหาดังกล่าว
หลายคนรู้จักระบบรู้จำเสียงพูดของมือถือค่ายใหญ่ๆ ซึ่งไทยก็มีการพัฒนาระบบรู้จำเสียงพูดภาษาไทยในชื่อ “พาที” (PARTY) โดยนักวิจัยจากศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) ซึ่ง ดร.ชัย วุฒิวิวัฒน์ชัย หัวหน้าโครงการวิจัยดังกล่าว ระบุว่าตั้งแต่เริ่มมีการพัฒนาแอปพลิเคชันนี้ บริษัทต่างชาติหลายบริษัทก็เริ่มแนะนำเทคโนโลยีแปลงสู่เสียงพูดเป็นข้อความออกมาบ้างแล้วตั้งแต่ปี 2555 ซึ่งค่ายมือถือรายใหญ่ยังไม่มีเทคโนโลยีดังกล่าวออกมา แต่เพียงไม่กี่หลังจากนั้นก็ได้เปิดตัวเทคโนโลยีที่รองรับภาษาไทยออกมา
ทว่าแม้ต่างชาติได้แนะนำระบบรู้จำเสียงพูดที่รองรับภาษาไทยออกสู่ตลาดแล้ว แต่นักวิจัยยังมองเห็นเห็นข้อจำกัดในหลายด้าน อาทิ ข้อจำกัดในการพัฒนาที่อิงกับตลาด ข้อจำกัดในการปรับปรุงให้เหมาะกับสภาพแวดล้อมเมืองไทย หรือค่าใช้จ่ายในการจ้างต่างชาติพัฒนาที่สูงมาก จึงเป็นเหตุผลให้ต้องพัฒนาระบบรองรับภาษาไทยโดยคนไทยเอง ซึ่งจะแอปพลิเคชันในราคาที่ไม่สูงเกินไป
แนวทางในการพัฒนา ดร.ชัยกล่าวว่าระบบรู้จำเสียงพูดต้องสามารถนำไปใช้ได้ทุกเนื้อหา โดยไม่จำกัดเพียงด้านใดด้านหนึ่ง มีความถูกต้องไม่ต่ำกว่า 80% ใช้งานได้บนสมาร์ทโฟน มีเว็บไซต์บริการให้หน่วยงานที่ต้องการนำไปพัฒนาแอปพลิเคชันต่อ และต้องตอบสนองได้เร็วในเวลาไม่เกิน 2 เท่าของเวลาที่ป้อนคำพูดให้ระบบ เช่น พูด 10 วินาที ระบบต้องตอบสนองได้ภายใน 20 วินาที เป็นต้น
หลังจากพัฒนามาตั้งแต่ปี 2556 ดร.ชัยเผยว่า ปัจจุบันระบบพาทีรองรับคำศัพท์กว่า 70,000 คำ และรู้จักคำและพยางค์เพื่อสร้างคำใหม่ได้ ซึ่งเป็นอัลกอลิทึมที่นักวิจัยไทยพัฒนาขึ้นเอง และมีคำศัพท์ที่ไม่รู้จักต่ำกว่า 1% โดยทั้งระบบใช้หน่วยความจำเพียง 4 เมกะไบท์ และตอบสนองได้ในเวลา 1.5 เท่าของเวลาป้องข้อมูลเสียง ส่วนผลการทดสอบความผิดพลาดพบว่า เมื่อเริ่มโครงการมีความผิดพลาดประมาณ 50% แต่เมื่อใกล้ปิดโครงการแล้วมีความผิดพลาดลดลงเหลือ 23% ใกล้เคียงกับระบบรู้จำเสียงพูดของค่ายผู้ผลิตมือถือรายใหญ่ 2 ค่าย ที่ให้ผลทดสอบความผิดพลาดเมื่อเดือน พ.ย.57 อยู่ที่ประมาณ 30%
ดร.ชัยเผยว่าเทคโนโลยีจากการพัฒนาระบบจำเสียงพูดนี้ยังไม่สมบูรณ์ 100% และยังต้องพัฒนาต่อตามการใช้งาน ซึ่งได้นำระบบนี้ไปทดสอบในการบันทึกเสียงประชุมรัฐสภาและศาลสถิติยุติธรรม ซึ่งปกติต้องใช้คนถอดเสียงการประชุมหรือไต่สวนคดีความ และยังได้เจรจากับภาคเอกชนเพื่อใช้ร่วมกับกล่องรับสัญญาณทีวีเพื่อควบคุมการเปลี่ยนช่องแทนรีโมตคอนโทรล และการพัฒนาการให้บริการของศูนย์บริการลูกค้าสัมพันธ์หรือคอลเซ็นเตอร์
ทางด้าน ศวิต กาสุริยะ นักวิจัยส่วนถ่ายทอดเทคโนโลยีในโครงการ เนคเทค อธิบายถึงการนำระบบไปใช้ในการปรับปรุงคอลเซ็นเตอร์ว่า ธุรกิจคอลเซ็นเตอร์นั้นมีอัตราความสำเร็จที่ลูกค้าตัดสินใจซื้อค้าถึง 1 ใน 10 ซึ่งผู้ประกอบการความต้องการขยายธุรกิจ แต่การขยายธุรกิจจำเป็นต้องควบคุมคุณภาพในการให้บริการ โดยทุกครั้งที่คอลเซ็นเตอร์ติดต่อลูกค้าจะมีการบันทึกเสียง ส่วนหนึ่งนั้นเพื่อนำไปสู่การตรวจสอบ แต่พบว่าการตรวจสอบนั้นมีสัดส่วนต่ำกว่า 3%
“ทุกวันนี้เขาใช้คนนั่งฟัง ถ้าเพิ่มผู้ให้บริการคอลเซ็นเตอร์ 100 คน ต้องเพิ่มคนนั่งฟังอีก 20 คน ตรงนี้เป็นค่าใช้จ่ายมหาศาล แต่พาทีจะถอดเสียงพูดของพนักงานออกมาเป็นข้อความให้ผู้ตรวจสอบนั่งคัดกรองคำพูดที่ไมเหมาะสม แม้จะถอดคำไม่ได้แม่นยำ 100% แต่ก็เป็นแนวทางได้” ศวิตกล่าว
*******************************