xs
xsm
sm
md
lg

10 ปี "เล็กซิตรอน" คลังศัพท์ 8 หมื่นคำ เพิ่มตามผู้ใ้ช้งาน 15 ล้านคน

เผยแพร่:   โดย: MGR Online

นายธเนศ เรืองรจิตปกรณ์ กับเล็กซิตรอนเวอร์ชันแรก
เครื่องมือแปลคำศัพท์อิเล็กทรอนิกส์ นับเป็นเทคโนโลยีที่เหมาะกับไลฟ์สไตล์ ของคนยุคนี้อย่างยิ่ง ผ่านมา 10 ปี “เล็กซิตรอน” พจนานุกรมอิเล็กทรอนิกส์ผลงานคนไทย ก็มียอดผู้ใช้งานมากถึง 15 ล้านคนแล้ว อีกทั้งจำนวนคำศัพท์ ก็เพิ่มขึ้นเกือบ 8 หมื่นคำ

พจนานุกรมอิเล็กทรอนิกส์ “เล็กซิตรอน” (Lexitron) สำหรับแปลคำศัพท์ไทย-อังกฤษ และอังกฤษ-ไทย มีให้ใช้งานในรูปแบบโปรแกรมออฟไลน์ และออนไลน์ ที่เข้าไปใช้งานได้ผ่าน http://lexitron.nectec.or.th ซึ่งคงเป็นที่คุ้นเคยสำหรับหลายๆ คน โดยหลังเปิดให้ใช้บริการได้ 10 ปี ปัจจุบันมีผู้ใช้งานมากถึง 15 ล้านคนแล้ว ตามข้อมูลของศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค)

นายธเนศ เรืองรจิตปกรณ์ ผู้ช่วยนักวิจัยห้องปฏิบัติการวิจัยมนุษยภาษา (เนคเทค) ซึ่งร่วมทำงานและพัฒนาเล็กซิตรอนมาได้ 3 ปี กล่าวกับผู้จัดการวิทยาศาสตร์ว่า ปกตินักภาษาศาสตร์ จะเป็นผู้พัฒนาพจนานุกรม แต่คำที่ได้ มักเป็นคำที่สวยหรูและคนทั่วไปไม่ค่อยได้ใช้งาน ส่วนเล็กซิตรอนนั้น เริ่มต้นจากผู้ใช้งาน โดยเริ่มสร้างตั้งแต่ปี 2538 จากข้อมูลคลังข้อความ ที่เก็บการใช้งานจริงของคนไทย แล้วนำไปให้นักภาษาศาสตร์จัดทำคำศัพท์นั้นๆ

สำหรับพัฒนาการของเล็กซิตรอนนั้น นายธเนศระบุว่า แรกสุดเล็กซิตรอนเป็นพจนานุกรมสำหรับระบบแปลอัตโนมัติ จากนั้นก็พัฒนาให้เป็นพจนานุกรมสำหรับการใช้งานทั่วไป โดยเวอร์ชันแรกสุดนั้นพัฒนาให้ใช้งานบนระบบปฏิบัติการวินโดว์ 3.11 (Window 3.11) ต่อมาในปี 2546 พัฒนาเพื่อใช้งานได้กับวินโดว์ 98 และให้บริการทั้งในรูปแบบออนไลน์และออฟไลน์ รวมถึงฐานข้อมูล (Database) ซึ่งรวบรวมคำและชนิดของคำสำหรับใช้ด้านการวิจัย จนกระทั่งปี 2551 ได้เพิ่มการออกเสียงและอักษรแทนเสียงเข้าไปด้วย

เริ่มแรกเล็กซิตรอนมีข้อมูลคำศัพท์ไทย-อังกฤษ 3 หมื่นคำ และอังกฤษ-ไทย 3 หมื่นคำ ปัจจุบันจำนวนคำศัพท์ไทย-อังกฤษ เพิ่มขึ้นเป็น 5.1 หมื่นคำ และคำศัพท์อังกฤษ-ไทย เพิ่มขึ้นเป็น 7.9 หมื่นคำ ซึ่งนายธเนศกล่าวกับผู้จัดการวิทยาศาสตร์ว่า หากมีคำศัพท์มากๆ จะเป็นฐานข้อมูลสำหรับไปใช้งานด้านอื่นด้วย และปัจจุบันการพัฒนา “อับดุล” (ABDUL) บอตสนทนาบนโปรแกรมเอ็มเอสเอ็นเมสเซนเจอร์ (MSN Messenger) ก็อาศัยฐานข้อมูลคำศัพท์จากเล็กซิตรอน

ด้าน ดร.เทพชัย ทรัพย์นิธิ นักวิจัยห้องปฏิบัติการวิจัยมนุษยภาษา เนคเทค หัวหน้าทีมพัฒนาเล็กซิตรอน เผยกับผู้จัดการวิทยาศาสตร์ว่า ปัจจุบันมีการนำเล็กซิตรอนไปใช้ประโยชน์ทั้งในมหาวิทยาลัย ภาคเอกชนและหน่วยงานราชการ รวมถึงใช้ฐานข้อมูลบนเว็บไซต์ อาทิ เว็บไซต์ longdo และ sanook เป็นต้น ทั้งนี้ในตอนเริ่มต้นพัฒนาเล็กซิตรอน ยังไม่มีคนไทยพัฒนาพจนานุกรมอิเล็กทรอนิกส์มาก่อน

ทั้งนี้ ดร.เทพชัยเผยอีกว่า ในขั้นตอนของการพัฒนาจะนำคำที่ใช้บ่อยไปให้นักภาษาศาสตร์ในทีมพัฒนาเล็กซิตรอนพิจารณาและเพิ่มเิติมคำศัพท์ที่ยังขาด และยังเปิดให้ผู้ใช้อัพโหลด (upload) คำศัพท์เข้าระบบ แล้วผู้ใช้ด้วยกันโหวตว่าควรใส่คำศัพท์ดังกล่าวเข้าไปหรือไม่ จากนั้นจึงให้นักภาษาศาสตร์ควบคุมคุณภาพของคำศัพท์ดังกล่าว

“คิดว่าคนใช้เล็กซิตรอน เพราะอิเล็กทรอนิกส์เป็นเรื่องที่ใกล้ตัว เราเข้าถึงข้อมูลได้ง่าย แม้แต่พีดีเอ (PDA) หรือไอโฟน (iPhone) ก็ใช้เล็กซิตรอนได้ อนาคตเล็กซิตรอนจะไม่ใช่ตัวคนเดียว แต่จะมีเครือข่ายมากขึ้น ส่วนการปรับปรุงเรายังต้องเพิ่มคำศัพท์ให้มากขึ้น และปรับปรุงคำศัพท์ที่มีอยู่โดยทีมนักภาษาศาสตร์ของเราเอง” ดร.เทพชัยกล่าว.
ดร.เทพชัย ทรัพย์นิธิ
กำลังโหลดความคิดเห็น