ผู้ช่วยศาสตราจารย์ ดร.อานนท์ ศักดิ์วรวิชญ์
อาจารย์ประจำสาขาวิชา Business Analytics and Intelligence และ Actuarial Science and Risk Management คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์
ผมในฐานะอาจารย์มหาวิทยาลัยที่สอนด้านการวิเคราะห์ธุรกิจและวิทยาการข้อมูล (Business analytics and data sciences) เห็นการแบ่งปันความรู้เกี่ยวกับศัพท์บัญญัติของราชบัณฑิตยสถานคำว่า Big data อันเป็นคำยอดนิยมใช้กันแพร่หลาย และเป็นสิ่งที่ตนเองสอนอยู่ เลยขอวิเคราะห์การบัญญัติศัพท์คำเดียวกัน ในสามสาขาวิชา คือ สถิติศาสตร์ คอมพิวเตอร์และเทคโนโลยีสารสนเทศ และศึกษาศาสตร์ดังนี้
ในสาขาวิชาศึกษาศาสตร์ พจนานุกรมศัพท์ศึกษาศาสตร์ร่วมสมัย ของราชบัณฑิตยสถาน เป็นสาขาวิชาแรกที่บัญญัติศัพท์ Big Data เป็นภาษาไทย ในปี 2561 โดยบัญญัติว่า ข้อมูลเกินนับ เผยแพร่ลงในหนังสือพิมพ์เดลินิวส์
โดยนิยามนี้ข้อมูลเกินนับ ได้อธิบาย 5V ของ Big data คือ Volume, Variety, Velocity, Veracity, และ Value
ต่อมาในวันที่ 3 กุมภาพันธ์ 2562 คณะกรรมการจัดทำพจนานุกรมศัพท์สถิติศาสตร์ ราชบัณฑิตยสถาน ได้บัญญัติศัพท์คำว่า Big Data เป็น ข้อมูลมหัต และอธิบายว่า ข้อมูลมหัตคือ เซตข้อมูลขนาดใหญ่ที่มีความซับซ้อนมาก ประกอบด้วยลักษณะอย่างน้อย 3 ประการ คือ 1. มีปริมาตร (volume) มาก 2. มีการเปลี่ยนแปลงอยู่ตลอดเวลาอย่างต่อเนื่อง (velocity) 3. มีความหลากหลายในโครงสร้างข้อมูล (variety) นอกจากนี้ อาจมีองค์ประกอบอื่นเพิ่มเติม เช่น มีความแปรผันสูงและมีความซับซ้อนมาก เนื่องจากอยู่ในรูปแบบต่าง ๆ ทั้งที่มีโครงสร้างที่แน่นอน เช่น เมทริกซ์ข้อมูล หรือไม่มีโครงสร้าง เช่น ข้อความ อีเมล วีดิทัศน์ หรือรวบรวมมาจากหลายแหล่ง
โดยนิยามนี้ข้อมูลมหัต เน้นไปที่ 3V ของ Big data คือ Volume, Variety, Velocity แต่ก็เขียนคำอธิบายโดยใช้คณิตศาสตร์ คือนิยามว่าเป็นเซต (Set) ที่มีความซับซ้อนมาก
และในวันที่ 28 มิถุนายน 2562 คณะกรรมการจัดทำพจนานุกรมศัพท์คอมพิวเตอร์และเทคโนโลยีสารสนเทศ ราชบัณฑิตยสถาน ได้มีมติให้บัญญัติศัพท์ Big Data เป็นข้อมูลขนาดใหญ่ หมายถึง ข้อมูลหลากหลายปริมาณมหาศาลที่เพิ่มขึ้นอย่างรวดเร็ว เช่น ข้อมูลดัชนีการค้นคืนของเว็บ ข้อมูลการสื่อสารทางโทรศัพท์เคลื่อนที่ ข้อมูลในเครือข่ายสังคม ข้อมูลการพยากรณ์อากาศ ข้อมูลภาพถ่ายดาวเทียม ฯลฯ
โดยนิยามนี้เน้นไปที่ ขนาดของข้อมูล (Volume) ใน 3V ของ Big data คือ Volume, Variety, Velocity และเน้นไปที่ข้อมูลไร้โครงสร้าง (Unstructured data) เป็นหลักด้วย
Big data ที่บัญญัติในทางศึกษาศาสตร์ ว่า ข้อมูลเกินนับ ขอวิเคราะห์ว่าเป็นการบัญญัติศัพท์ โดยไม่สอดคล้องกับความเป็นจริงๆ ของคำนั้น Big Data สามารถนับได้ มิใช่อสงไขย อจินไตย อนันต์ อันมิอาจจะนับได้ถ้วนอย่างที่นิยามในคณิตศาสตร์
ในความเป็นจริงมีขั้นตอนวิธี (Algorithm) ในการนับ Big data ได้มากมาย โปรดอ่านได้จาก https://www.kdnuggets.com/2019/08/count-big-data-probabilistic-data-structures-algorithms.html ทำให้มีความเห็นว่าการบัญญัติศัพท์ ข้อมูลเกินนับ ขาดความแม่นยำในเชิงวิชาการ และไม่น่าจะเหมาะสมถูกต้องเลย เพราะไม่ตรงกับความหมายแท้จริงในภาษาอังกฤษ อีกทั้งการแปลคำว่า Big เป็นคำว่าเกินนับก็น่าจะไม่ถูกต้องทั้งในเชิงศาสตร์ด้านภาษาศาสตร์ (Linguistics) และในเชิงศาสตร์ด้านวิทยาการข้อมูล (Data Sciences)
Big data ที่บัญญัติในทางคอมพิวเตอร์และเทคโนโลยีสารสนเทศ ว่า ข้อมูลขนาดใหญ่ ก็มีความคลาดเคลื่อนในเชิงมโนทัศน์ ที่อาจจะทำให้ผู้อ่าน ผู้ปฏิบัติงาน นิสิต นักศึกษา และวงวิชาการ เข้าใจว่า Big Data มีเพียง Big Volume เพียงเท่านั้น
ทั้งๆ ที่ 3V ของ Big Data อาจจะ Big Variety คือมีความหลากหลายมากในรูปแบบของข้อมูล เช่น ภาพ คลื่น เสียง สื่อสังคม ข้อความ ภาพเคลื่อนไหว และภาพเคลื่อนไหวสามมิติ และอื่นๆ อีกมากที่อาจจะเกิดขึ้นในอนาคตได้อีก
Big Velocity มีความเร็วยิ่งใหญ่ มีข้อมูลไหลเข้าเป็นรายวินาที เป็นกระแสต่อเนื่องของข้อมูล (Data Streaming) และมีการวิเคราะห์ข้อมูล ณ ขณะปัจจุบัน (Real time analytics) อีกด้วยเป็นต้น
เหตุที่ Volume เป็นแค่ด้านเดียวของ Big data ไม่ควรแปล Big data ว่าข้อมูลขนาดใหญ่ เพราะมันมี V อื่น คือ Value, Veracity, Velocity, Variety ด้วย ดังนั้นข้อมูลขนาดใหญ่น่าจะเป็นการบัญญัติศัพท์ที่คลาดเคลื่อนไม่ตรงกับทฤษฎีและการปฏิบัติ
Big data ที่บัญญัติในทางสถิติศาสตร์ ว่าข้อมูลมหัต น่าจะเป็นการใช้คำยาก ใช้ศัพท์สูง และพยายามออกแขกให้ดูขลังมากเกินไป อาจจะทำให้เข้าใจได้ยาก ต้องแปลไทย เป็นไทย ไม่น่าจะติดตลาด คือไม่นิยมใช้แพร่หลาย ยากเกินไป ถ้ามีคำไทยง่ายๆ ไม่น่าจะมีความจำเป็นต้องออกแขกหรือดึงศัพท์ภาษาบาลีและสันสกฤตมาใช้บัญญัติศัพท์ให้ยุ่งยากโดยไม่มีความจำเป็น
นอกจากราชบัณฑิตยสถานจะบัญญัติศัพท์คำว่า Big data ออกมาหลายคำแล้ว นักวิชาการ สื่อมวลชนหลายคนก็บัญญัติศัพท์ใหม่ๆ เช่น อภิมหาข้อมูล มีอาจารย์มหาวิทยาลัยที่ผมรู้จักดีเป็นผู้บัญญัติคำนี้ และโดยส่วนตัวอาจารย์เป็นคนน่ารักมากนะครับ แต่การแปลคำว่า Big data เป็นอภิมหาข้อมูล ผมตกใจเล็กน้อยครับ แต่จินตนาการว่าคงคล้ายปกเทป ที่จะตั้งชื่อปกเทปหรืออัลบั้มเพลงลูกทุ่งหรือเพลงลูกกรุง นิยมใช้ว่าอภิมหาอมตะ นิรันดร์กาล อารมณ์ผมนี่นึกถึงรุ่นนั้นเลยครับ ซึ่งเป็นช่วงที่ผมเป็นเด็กๆ คงเป็นช่วงที่อาจารย์ท่านนั้นเป็นนักศึกษาหรือเพิ่งเริ่มต้นทำงาน เหมือนๆ กัน อายุเราไม่ต่างกันมาก
และบางคนก็ทับศัพท์ไปตรงๆ ว่า บิ๊กเดต้า ตกลง Big data ภาษาไทยควรใช้คำไหน ผมเห็นแชร์กันในอินเตอร์เน็ต อ้างอิงกันว่า ดร.ครรชิต มาลัยวงศ์ ราชบัณฑิต สาขาสารสนเทศ ได้กล่าวไว้ว่า ถ้าคำไหนยังไม่บัญญัติให้เขียนทับศัพท์ เช่น big data ใช้ว่า บิ๊กเดต้า
สำหรับตัวผมเองแปลคำว่า Big data ว่าข้อมูลใหญ่ เพราะคิดว่าเป็นคำไทยง่ายๆ ที่ไม่ต้องแปลไทยเป็นไทย ตรงกับความหมายในภาษาอังกฤษ และเปิดรับคำนิยามไม่ว่าจะ 3V หรือ 5V ของ Big data ได้
การบัญญัติศัพท์นั้นมีมานานมากแล้ว พระบาทสมเด็จพระมงกุฎเกล้าเจ้าอยู่หัว ทรงบัญญัติศัพท์คำว่า เสรีภาพ ขึ้นมาใช้ในภาษาไทย
ศัพท์บัญญัตินั้นไม่ใช่เรื่องง่าย นักวิชาการชาวไทยที่ทรงมีผลงานด้านการบัญญัติศัพท์ภาษาต่างประเทศเป็นภาษาไทยมากที่สุดคือ ศาสตราจารย์ พลตรี พระเจ้าวรวงศ์เธอ กรมหมื่นนราธิปพงศ์ประพันธ์ (25 สิงหาคม พ.ศ. 2434 - 5 กันยายน พ.ศ. 2519) อดีตรองนายกรัฐมนตรี อดีตประธานสมัชชาองค์การสหประชาชาติ และอดีตนายกราชบัณฑิตยสถาน รวมถึงเป็นผู้ร่วมสถาปนาสถาบันบัณฑิตพัฒนบริหารศาสตร์
ตัวอย่างศัพท์ภาษาไทยที่ทรงบัญญัติแล้วใช้กันแพร่หลายมากได้แก่ คำว่า อัตโนมัติ (Automatic) รัฐธรรมนูญ (Constitution) ประชาธิปไตย (democracy) โทรทัศน์ (television) วิทยุ (radio) นิเทศศาสตร์ (Communication Arts) วารสารศาสตร์ (Journalism) สื่อสารมวลชน (Mass Communication) ปฏิรูป (Reform) ปฏิวัติ (Revolution) และ วัฒนธรรม (Culture)
ต่อไปนี้จะเรียกพระนามให้กระชับว่า เสด็จในกรมฯ ทั้งนี้เสด็จในกรมฯ ได้ทรงแสดงความเห็นว่าศัพท์บัญญัติคำใดไม่ติดตลาดก็ต้องตกไปในที่สุด ศัพท์บัญญัติของคำว่า Big data ก็เช่นกัน คงต้องรอดูสักพักว่าคำไหนจะได้รับการยอมรับแพร่หลายมากที่สุด
เมื่อผมได้อ่านหนังสือ “งานบัญญัติศัพท์ของพลตรี พระเจ้าวรวงศ์เธอ กรมหมื่นนราธิปพงศ์ประพันธ์” ซึ่งธนาคารกรุงเทพ จัดพิมพ์ถวายในงานพระราชทานเพลิงพระศพเสด็จในกรมฯ
ทำให้ผมได้เรียนรู้หลักการในการบัญญัติศัพท์ ที่น่าสนใจมากของเสด็จในกรมฯ ดังนี้
ประการแรก การบัญญัติศัพท์ ต้องบัญญัติให้ตรงความหมายแม่นยำ เสด็จในกรมฯ ได้ทรงนิพนธ์ไว้ว่าทรงได้เรียนรู้จากการบัญญัติศัพท์คำว่าเสรีภาพ โดยพระบาทสมเด็จพระมงกุฎเกล้าเจ้าอยู่หัวว่า ความหมายของคำมีอยู่สองสถาน 1. ความหมายตามธาตุของศัพท์ (Denotation) และ 2. ความหมายที่นิยมใช้ (Connotation) ความหมายที่นิยมใช้เปลี่ยนไปตามกาละเทศะ เช่นคำว่า เสรี ความหมายตามธาตุของศัพท์ก็แปลว่าตนเป็นใหญ่ ความหมายนิยมใช้ในทางดีก็แปลว่า อิสระ ความหมายนิยมใช้ในทางเลว ก็แปลว่า เสเพล พระองค์ผู้ทรงคิดศัพท์ “เสรีภาพ” ขึ้นในภาษาไทยทรงใช้ในความหมายที่ดี นี่ก็เป็นความหมายในภาษาไทย
ด้วยเหตุนี้ Big data ที่บัญญัติว่า ข้อมูลเกินนับ และ ข้อมูลขนาดใหญ่ จึงไม่ตรงความหมายแม่นยำ ทั้งความหมายตามธาตุของศัพท์และความหมายที่นิยมใช้
ประการที่สอง เสด็จในกรมฯ ทรงนิพนธ์ ไว้ว่า ควรใช้คำไทยก่อนจะเข้าหาคำบาลี-สันสกฤต โดยทรงอธิบายไว้ดังนี้
"ในการจะเข้าถึงประชาชนนั้น เราจะใช้คำอังกฤษซึ่งยังไม่ได้ซาบซึ้งเข้าไปในระบบความคิดของเรานั้นไม่ได้ ถ้าเราหาคำไทยได้ก็ยิ่งดี แต่ถ้าเราหาไม่ได้ก็หันหน้าเข้าหาคำบาลี-สันสกฤต.."
ประการที่สาม เสด็จในกรมฯ ทรงแนะนำหลักการบัญญัติศัพท์ว่า “การคิดศัพท์ทำตามใจชอบผู้คิดศัพท์ไม่ได้ จะต้องมีความหมายที่ต้องการ และยิ่งไปกว่านั้นจะต้องมีรูปอันเป็นที่ยอมรับแก่อัจฉริยลักษณ์ของภาษาอีกด้วย” อัจฉริยลักษณ์ของภาษา หรือ Genius ของภาษาได้แก่ความสำคัญของทำนองเสียงและลำนำจังหวะ
ศัพท์บัญญัติคำหนึ่งที่ติดมากคือคำว่า อัตโนมัติ ซึ่งเสียงคล้ายกันกับ Automatic ในภาษาอังกฤษ และมีจังหวะหรือลำนำของความเคลื่อนไหวในเสียงของคำ ที่น่าจะเป็นไปอย่างคล่องแคล่วทันทีทันใด เป็นต้น
ด้วยเหตุผลประการที่สองและสามนี้ การบัญญัติศัพท์คำว่า Big data เป็นคำว่า ข้อมูลมหัต จึงเป็นการหันหน้าเข้าหาคำบาลี-สันสกฤต โดยไม่จำเป็น และทำให้เข้าใจยาก อีกทั้งเสียงก็ขาดความไพเราะและละเลยอัจฉริยลักษณ์ของภาษาไทยด้วย
ประการที่สี่ การบัญญัติศัพท์ ไม่ควรขัดแย้งกันเองในแต่ละสาขาวิชา เสด็จในกรมฯ ทรงนิพนธ์ไว้ว่า “(การ)บัญญัติศัพท์ วิชาใดวิชาหนึ่ง ไม่ควรให้ขัดกันกับอีกวิชาแผนกหนึ่ง เช่น ศัพท์การฑูตไม่ควรจะขัดกับศัพท์ทางกฎหมาย คำว่าสัญญานั้น ทางกฎหมายใช้หมายความถึง Contract และเราควรจะสงวนคำว่าสัญญานี้ไว้ใช้โดยนัยว่า Contract เสมอไป อันที่จริงคำว่าสัญญาตามศัพท์บาลีหมายความว่า ความกำหนดหมายหรือเครื่องหมาย แต่เมื่อประมวลกฎหมายแพ่งและพาณิชย์ได้บัญญัติคำว่า สัญญา ให้ตรงกับคำว่า Contract แล้ว เราก็ควรจะสงวนเอาไว้ใช้โดยนัยนี้เท่านั้น ฉะนั้นการที่ได้แก้คำว่า อาณัติสัญญา เป็นอาณัติสัญญาณ หรือใช้ร่นลงมาเป็นสัญญาณ ซึ่งหมายถึง Signal ก็เป็นอันชอบแล้ว”
ตามหลักการบัญญัติศัพท์ของเสด็จในกรมฯ คงไม่ประสงค์ที่จะให้สามสาขาวิชา ที่กล่าวถึงเรื่องเดียวกัน คำเดียวกันในภาษาอังกฤษทุกประการ บัญญัติศัพท์ออกมาไม่ตรงกันเลย เป็น ข้อมูลขนาดใหญ่ ข้อมูลเกินนับ ข้อมูลมหัต
แต่ข้อนี้ก็น่าเห็นใจราชบัณฑิตทั้งสามสำนัก ที่ในปัจจุบัน พรมแดนแห่งความรู้ขยายตัวอย่างรวดเร็ว และการสื่อสารและการเปลี่ยนแปลงของภาษาและเทคโนโลยีก็ไปอย่างรวดเร็วเช่นกัน หากต้องให้สาขาวิชาต่างๆ ใช้ศัพท์บัญญัติที่ไม่ขัดแย้งกันเอง ก็คงต้องใช้ความพยายามอย่างยิ่งยวด และคงไม่มีราชบัณฑิตท่านใดที่จะสามารถรู้หรือมีพรมแดนแห่งความรู้ข้ามศาสตร์สาขาจนพบความขัดแย้งดังกล่าวได้อย่างชัดเจนและพยายามทำให้เกิดความสอดคล้องกันได้อย่างทันท่วงที
ประการที่ห้า เสด็จในกรมฯ ทรงมีทัศนะว่าศัพท์บัญญัติมีลักษณะเดียวกันกับภาษา คือมีพลวัตและมีการเปลี่ยนแปลงได้ ศัพท์บัญญัติใดที่บัญญัติได้ดีและทำให้ติดปากผู้ใช้ ก็จะคงอยู่ต่อไป โปรดอ่านลายพระหัตถ์ด้านล่างนี้ ย่อมทำให้เห็นถึงความเป็นปราชญ์และความถ่อมพระองค์ของเสด็จในกรมฯ ได้เป็นอย่างดียิ่ง ทรงพยายามจะบัญญัติศัพท์ในแผนกวิชาที่ทรงเชี่ยวชาญและเคารพผู้ใช้ภาษาคือประชาชน เป็นอย่างสูง
ศัพท์บัญญัติ เป็นเครื่องหมายแห่งความเจริญของวงวิชาการในแต่ละประเทศ หากราชบัณฑิตยสถานสามารถบัญญัติศัพท์ให้ทันต่อเวลาและความก้าวหน้าของวิทยาการต่างๆ และทำให้ติดปากประชาชนใช้กันแพร่หลายได้ ก็ย่อมเป็นการดีต่อความก้าวหน้าของวงวิชาการในประเทศไทยเช่นกัน ซึ่งคงต้องพิเคราะห์ดูต่อไปว่าศัพท์บัญญัติคำว่า Big data คำใดจะติด หรือจะไม่ติดเลยสักคำ เวลาจะเป็นเครื่องพิสูจน์