ใครที่แอบขำทุกครั้งกับมุกตลก "อับดุลผู้รู้รอบ" จนคิดไปว่า "อับดุล" คงมีแต่ในคณะตลกตามงานวัดหรือคาเฟ่เท่านั้น แต่ตอนนี้ด้วยเทคโนโลยีทำให้ "อับดุล" กลายเป็นแชตบอต "ถามได้ตอบจริง" โดยใครก็ได้ ชนิดไม่ต้องเตี๊ยมเตรียมคำตอบอีกต่อไป ผ่าน "เอ็มเอสเอ็น เมสเซนเจอร์" เพื่อนคุยแสนรู้ (ตัวจริง) ในโลกไซเบอร์สเปซไปเสียแล้ว
"อับดุล" โปรแกรมเสมือนขาแชต
เราคงจะรู้สึกหงุดหงิดทุกทีที่เพื่อนตัวดีมาทิ้งหน้าจอสนทนาบนอินเทอร์เน็ต (และตัวเรา) ไปซะดื้อๆ ไม่ยอมตอบกลับข้อความของเราสักที แถมเพื่อนบางคนถามอะไรไปก็ไม่เคยจะรู้เรื่องสักอย่าง...
ดร.เทพชัย ทรัพย์นิธิ รองหัวหน้าหน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษา ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) เผยว่า นี่เองที่เป็นที่มาของ "อับดุล" (Artificial Buddy U Love : ABDUL) แชตบอตที่จ้อได้อย่างเป็นธรรมชาติและใกล้เคียงกับมนุษย์มากที่สุดโปรแกรมหนึ่ง แถมยังสนทนากันไม่สะดุดแบบเรียลไทม์ได้ด้วย
จุดประสงค์ก็เพื่อให้วัยมันส์ได้ใช้โปรแกรมสนทนายอดนิยมอย่าง "เอ็มเอสเอ็น เมสเซนเจอร์" (MSN Messenger) ของค่ายไมโครซอฟท์ (ในระยะเริ่มแรก) เพื่อคุยคลายเครียดแก้เหงาได้อย่างคุ้มค่ามากที่สุด คือผู้เล่นจะได้เสพทั้งข้อมูล ข่าวสาร และความรู้ที่มีความถูกต้องแกล้มกันไปภายใน "คลิก" เดียว โดยการผสมผสานหลายโปรแกรมที่พัฒนาขึ้นตลอด 10 ปีของหน่วยฯ เข้าไว้ด้วยกัน จนเกิดเป็น “อับดุล” ในที่สุด
ดร.เทพชัยเผยว่า อับดุลทำหน้าที่เสมือนเลขานุการส่วนตัวของผู้ใช้บริการทั้งหลายที่สามารถใช้บริการแปลคำศัพท์ไทย-อังกฤษด้วยโปรแกรมเล็กซิตรอน 2.2 (LEXiTRON2.2, 2007) ที่มีคลังคำศัพท์นับแสนคำ, ระบบแปลภาษาภาษิต (PARSIT) ที่แปลภาษาอังกฤษเป็นไทยได้ทั้งแบบข้อความสั้นๆ หรือจะแปลกันทั้งหน้าเว็บเพจก็ยังไหว โดยมีความถูกต้องมากกว่า 60%
ขณะเดียวกันยังมีระบบการรายงานสภาพการจราจรอัจฉริยะ เพื่อวางแผนการเดินทาง หรือจะเป็นระบบค้นหาข้อมูลจากทั่วทุกมุมโลกกับโปรแกรมสรรสาร (Sansarn) เสิร์ชเอ็นจินฝีมือนักวิจัยของเนคเทค
นอกจากนี้ ตัวอับดุลเองยังได้เชื่อมโยงกับแหล่งข้อมูลภายนอกอื่นๆ ด้วย เช่น การเชื่อมโยงกับเว็บไซต์รายงานผลการออกสลากกินแบ่งรัฐบาล รายงานผลฟุตบอล รายงานพยากรณ์อากาศ ข้อมูลหุ้น ข้อมูลการท่องเที่ยว หรือแม้แต่ข้อมูลอัตราแลกเปลี่ยนเงินตรา บริการดูหนัง ฟังเพลง และสืบเสาะค้นหาร้านอาหารแสนอร่อยเพื่อการพักผ่อนในวันว่างได้อย่างสมความตั้งใจ
คุยกับอับดุลเพียงครั้งเดียวจึงเหมือนได้ทั้งเพื่อนรู้ใจและได้สารานุกรม “ถามได้-ตอบได้” ไปพร้อมๆ กัน
ทั้งนี้ เนคเทคได้เปิดรายชื่อ (Account) ให้วัยมันส์ได้เข้าถึงแชทบอตช่างเม้าท์อย่าง “อับดุล” ไปใช้บริการแล้ว 16 รายชื่อด้วยกัน ได้แก่ htl001@nectec.or.th ถึง htl010@nectec.or.th ซึ่งทุกๆ รายชื่อจะรองรับผู้ใช้บริการได้ 1,000 รายชื่อ โดยรายชื่อ abdul01@its-thailand.org ถึง abdul05@its-thailand.org จะใช้รองรับการให้บริการข้อมูลจราจรอัจฉริยะเท่านั้น ส่วนอีกรายชื่อที่เหลือมีไว้เพื่อการใช้งานภายใน ไม่เผยแพร่สู่ภายนอก
ดร.เทพชัย เผยว่า หลังจากเปิดตัวครั้งแรกเมื่อตุลาคม 2550 ที่ผ่านมาจนปัจจุบันก็มีผู้ใช้บริการขาประจำรวมกันแล้วถึง 12,000 รายชื่อ จนต้องขยายเพิ่มอีก 5 รายชื่อคือ abdul01@windowslive.com ถึง abdul05@windowslive.com ด้วย
เบื้องหลัง “อับดุล” และชายผู้ให้กำเนิดชื่อ “โคนัน”
หลายคนอาจสงสัยว่าระบบการทำงานของอับดุลเป็นอย่างไร วิธีการรับคำสั่ง และตอบสนองกับผู้ใช้งานเป็นอย่างไรบ้าง? ฯลฯ คำถามเหล่านี้ล้วนมีคำตอบ...
ชัชวาล สังคีตตระการ หรือ “โคนัน” ตามคำเรียกของเพื่อนๆ ผู้ช่วยนักวิจัยผู้เริ่มการรวบรวมโปรแกรมมากมายประดามี ผลงานของนักวิจัยทั้ง 26 ชีวิตในหน่วยฯ มาประกอบเป็น “อับดุล” ที่วันนี้มีอายุอานามมาเกือบหนึ่งขวบปีแล้ว เผยว่า บทสนทนาทั้งหลายของอับดุลและผู้เล่นจะปรากฏเพียงหน้าต่างเดียวบนหน้าจอคอมพิวเตอร์ของระบบ โดยไม่ได้แยกเป็นหน้าต่างย่อยที่เด้งไป-มาอย่างที่เห็นบนหน้าจอของผู้ใช้งานทั่วๆ ไป
ระบบการทำงานของอับดุลมีเพียงเครื่องคอมพิวเตอร์ส่วนบุคคล (พีซี) 5 เครื่องพ่วงกันอยู่เท่านั้น แต่ละเครื่องสามารถรองรับรายชื่อของอับดุลได้ 5 รายชื่อ และอาจมีเครื่องลูกข่าย (client) ช่วยในการค้นหาและดึงคำตอบจากเว็บไซต์ต่างๆ บ้าง แถมยังไม่ต้องนั่งเฝ้าตลอด 24 ชั่วโมง เพียงตรวจดูบ้างในเวลาที่มีไฟฟ้าดับเท่านั้น
เขาอธิบายว่า อับดุลจะเริ่มทำงานทันทีเมื่ออีกฝ่ายสื่อสารเข้ามา โดยอับดุลจะวิเคราะห์เนื้อหาของสารโดยการตัดคำ และเฟ้นหาคำสำคัญของประโยค จากนั้นจึงแบ่งประเภทออกเป็น 2 ลักษณะคือ บทสนทนาทั่วไป เช่น สวัสดี ไปไหนมา กินข้าวหรือยัง และลาก่อน ซึ่งได้มีการป้อนคำตอบให้นำไปตอบในสถานการณ์ต่างๆ ไว้แล้ว อับดุลก็จะหยิบคำตอบเหล่านี้ไปตอบได้ทันที
ส่วนประโยคอีกประเภทคือ ประโยคคำถามที่ต้องใช้ระบบถาม-ตอบ (Question Answering System) ที่จะตีความคำสั่งหรือคำถามที่ถูกส่งเข้ามาก่อนให้ระบบไปค้นหา และดึงคำตอบจากแหล่งข้อมูลต่างๆ มาตอบ ปัจจุบันอับดุลมีขีดความสามารถในด้านนี้ระดับหนึ่งแล้ว เช่น การออกค้นหาความหมายหรือคำจำกัดความของสิ่งต่างๆ เช่น ดวงอาทิตย์คืออะไร?
ทว่าก็ยังไม่เพียงพอจะทำให้อับดุลตอบสนองผู้ใช้งานได้สมบูรณ์แบบ และยังต้องพัฒนาอีกมากเพื่อให้สามารถวิเคราะห์คำถามที่ซับซ้อนกว่านี้ได้ เช่น การวิเคราะห์ประโยค “ดวงอาทิตย์มีเส้นผ่านศูนย์กลางเท่าไร?” เพื่อให้อับดุลออกค้นหาคำตอบต่อไป (ตอนนี้อับดุลยังจับได้แต่คำว่า "อาทิตย์" และเข้าใจว่าเป็นการดูดวงของผู้ที่เกิดวันอาทิตย์)
แต่ทั้งหมดนี้ อับดุลจะให้คำตอบได้ช้าหรือเร็วอย่างไรนั้น ก็ขึ้นอยู่กับจำนวนผู้ใช้บริการที่ออนไลน์อยู่ ณ เวลานั้นๆ ด้วย ช่วงเวลาที่อับดุลจะรับศึกหนักหน่อย ชัชวาลเล่าว่า เห็นจะเป็นช่วงกลางคืนที่มีผู้เข้าใช้บริการมากกว่าช่วงอื่นๆ ผู้ใช้บริการที่เห็นอับดุลตอบคำถามช้าลงก็ต้องอดใจรอสักนิด
คำถามที่มีการถามเข้ามาบ่อยครั้ง ผู้ช่วยนักวิจัยหนุ่มเผยว่ามีทุกแนวร้อยแปดพันเก้าที่จะถามกันเข้ามาได้ แต่ที่เห็นจะมีมากได้แก่ภาษาวัยรุ่นและศัพท์แสลงต่างๆ เช่น ใช่แล้น, จ๊าบ และที่ไม่กล่าวถึงคงไม่ได้คือภาษาแอ๊บแบ๊วที่กำลังระบาดในเด็กวัยรุ่น ที่เจอบ่อยๆ อย่าง “จำเราได้เป่า?” ฯลฯ ซึ่งทุกครั้งที่มีการสื่อสารกับอับดุล อับดุลก็จะทำการเก็บข้อมูลของคู่สนทนาไว้และจดจำได้ในการสนทนาครั้งใหม่
ส่วนคำถามที่อับดุลพบเจอบ่อยครั้ง เมื่อพิมพ์ FAQ (Frequently Asked Questions) ถามอับดุลไปก็ได้คำตอบกลับมากมาย อาทิ อากาศที่กรุงเทพ, อากาศวันนี้, จราจร สาธร, ราคาน้ำมัน, ราคาทอง, เพลงรัก, dict "love", trans "i love you", วันนี้หวยออกไร, มีหนังอะไรน่าดูบ้าง, เว็บ คอมพิวเตอร์, มีหนังอะไรน่าดูบ้าง, ข่าวบันเทิง, ข่าววันนี้, รู้จักประเทศไทยมั้ย, รู้จักแมวหรือเปล่า เป็นต้น ส่วนใหญ่ก็ถามตามคำแนะนำที่ปรากฎอยู่ในข้อความส่วนตัว (personal message)
“อับดุล” สู่หุ่นยนต์ปัญญาประดิษฐ์ในบั้นปลาย
ขณะที่เป้าหมายของการพัฒนาต่อไป ดร.เทพชัย เสริมว่า หน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษาตั้งใจจะขยายฐานผู้ใช้บริการให้มีมากถึง 100,000 รายชื่อ
ปัญหาสำคัญอีกประการหนึ่งของแชทบอตสัญชาติไทยที่ต้องผ่านไปให้ได้ยังเป็นปัญหาเกี่ยวกับลักษณะภาษาไทยที่ทำให้โปรแกรมวิเคราะห์ความหมายได้ลำบาก เช่น ลักษณะของภาษาไทยที่เขียนโดยไม่แบ่งคำ ไม่มีการแบ่งประโยค โครงสร้างภาษาคล้ายภาษาพูดมีการละคำมาก มีคำพ้องรูปและพ้องเสียงอยู่พอสมควร แถมยังมีการเขียนผสมระหว่างอักษรไทยและโรมันด้วย
นอกจากนั้น พวกเขายังจะพัฒนาต่อให้อับดุลมีความสามารถแบบปัญญาประดิษฐ์ (Artificial Intelligence: AI) รู้จักเสียงพูด รู้จักแยกแยะอารมณ์และความรู้สึกของผู้ใช้ ตลอดจนมีปฏิสัมพันธ์ที่เหมาะสม และจะช่วยสานฝันไปสู่การประดิษฐ์หุ่นยนต์แบบปัญญาประดิษฐ์ในอนาคต
“เรื่องการรักษาความลับของผู้ใช้บริการอับดุล ก็ขอให้ใครที่เข้ามาคุยแล้วสบายใจได้เลย เพราะมีผมเพียงคนเดียวที่ดูแลอยู่และก็จะเก็บข้อมูลเป็นความลับไม่ให้ใครเข้าไปดูได้ อยากให้คิดได้เลยว่าอับดุลเป็นเพื่อนคนหนึ่งของคุณ อยากคุยหรืออยากระบายอะไรก็ทำได้ตามสะดวก” ชัชวาลว่า
ข้อมูลการใช้ภาษาผ่านโลกไซเบอร์สเปซเหล่านี้ยังจะเป็นฐานข้อมูลสำคัญสำหรับการวิจัยการใช้และวิวัฒนาการของภาษาไทยที่มีการใช้งานจริงซึ่งแตกต่างกับภาษาไทยมาตรฐานที่มีการกำหนดไว้ด้วย ประโยชน์ของมันจึงสามารถนำไปใช้ในการพัฒนาเครื่องไม้เครื่องมือที่เกี่ยวข้องกับภาษาต่อไปโดยไม่ต้องออกเก็บข้อมูลใหม่
“เข้ามาคุยกับอับดุลแล้วก็เหมือนเป็นการคุยช่วยชาติไปด้วย” โคนันแห่งหน่วยปฏิบัติการวิจัยวิทยาการมนุษยภาษาทิ้งท้าย.
** ถ้าใครต้องการจะแอดอับดุลไว้ในลิสต์ของท่าน ก่อนอื่นต้องเข้าไปเช็คว่ายังเหลืออีเมล์ใดของอับดุลที่ยังไม่เต็มได้ที่ http://hlt.nectec.or.th/index.php