ผู้ช่วยศาสตราจารย์ ดร.อานนท์ ศักดิ์วรวิชญ์
ผู้อำนวยการหลักสูตรปรัชญาดุษฎีบัณฑิตและวิทยาศาสตรมหาบัณฑิต
สาขาวิชาการวิเคราะห์ธุรกิจและวิทยาการข้อมูล
https://www.facebook.com/BusinessAnalyticsNIDA/
คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์
ผู้อำนวยการหลักสูตรปรัชญาดุษฎีบัณฑิตและวิทยาศาสตรมหาบัณฑิต
สาขาวิชาการวิเคราะห์ธุรกิจและวิทยาการข้อมูล
https://www.facebook.com/BusinessAnalyticsNIDA/
คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์
ปัญหาใหญ่ในวงการวิทยาการข้อมูลที่ชอบพูดกันเสมอว่าข้อมูลคือสินแร่ที่ต้องทำเหมือง ต้องกลั่นกรองของมีค่าออกมา ปัญหาของข้อมูลคือหวงเอาไว้ แต่เอาออกมาใช้ไม่ได้ ใช้ไม่เป็นด้วย ไม่รู้วิธีจะใช้ด้วย เปรียบไปเปรียบมาก็เหมือนกับหมาหวงก้าง
ทำไมถึงเป็นหมาหวงก้าง เพราะหมานั้นไม่สามารถกินก้างปลาได้เนื่องจากสำรอกก้างปลาไม่เป็นเหมือนแมว การที่หมาได้ก้างปลาไปถึงไม่มีประโยชน์แม้จะหวงไว้ก็กินไม่ได้อยู่ดี ข้อมูลก็เช่นกัน เจ้าของข้อมูลอาจจะมีข้อมูลอันมีค่า แต่ใช้ไม่เป็นเลยหวงเอาไว้เป็นหมาหวงก้าง ยิ่งหน่วยราชการแล้วยิ่งเป็นหมาหวงก้างข้อมูล ข้ออ้างใหญ่ที่ใช้เป็นประจำคือเป็นความลับของทางราชการ โปรดอ่าน เมื่อ “หน่วยราชการ” หวงข้อมูล แล้วไทยจะไปสู่ยุค Big Data ได้อย่างไร?
ส่วนบริษัทก็มักจะกลัวและหวงข้อมูลยิ่งกว่าทางราชการ เพราะเป็นความลับทางการค้า ความลับของบริษัท เคยมีบริษัทแห่งหนึ่งส่งพนักงานมาเรียนและให้พนักงานนำข้อมูลของบริษัทมาใช้ทำเป็นวิทยานิพนธ์หรือการค้นคว้าอิสระโดยลงนามยินยอมมา (Informed Consent) แต่สั่งนักศึกษาว่าห้ามไม่ให้อาจารย์ที่ปรึกษาเห็นข้อมูลจริงแม้แต่บรรทัดเดียว อาจารย์ที่ปรึกษาคือผมก็ advice ให้คำปรึกษาโดยที่ไม่มีโอกาสได้เห็นข้อมูลหรือแม้กระทั่ง printout ของการวิเคราะห์เลย ผลงานก็ออกมาเละเทะ ไม่ดีนัก เพราะเท่ากับนักศึกษาต้องดูเอาเอง คิดเอาเองทั้งหมด และอาจารย์ที่ปรึกษาเองก็ไม่ได้เห็นภาพอะไร ตกลงเขามองว่าอาจารย์ที่ปรึกษามีหูตาทิพย์ มีทิพยญาณสามารถเห็นทุกอย่างได้เอง โดยไม่ต้องดูข้อมูลเลย อย่างนั้นคงเป็นเจน ญาณทิพย์ มากกว่า data scientist ที่ต้องเห็นข้อมูลก่อนถึงจะรู้ว่าควรทำอะไรต่อไปได้
ปัญหา data silo เป็นปัญหาคลาสสิกของคนที่ทำงานด้านข้อมูล แก้ไขได้ยาก เพราะต้องเปลี่ยนวัฒนธรรมและทัศนคติของคนในองค์การ
มาลองวิเคราะห์กันว่าการที่หน่วยงานซึ่งมีข้อมูลพยายามจะหวงข้อมูลไว้อาจจะมีด้วยกันหลายสาเหตุ เพราะอะไรบ้าง
1. ข้อมูลคืออำนาจ หากข้อมูลตกไปอยู่ในมือผู้อื่นแล้วตนเองก็จะหมดความสำคัญลงและไม่มีอำนาจอีกต่อไป หัวหน้าหน่วยงานจำนวนมากต้องการมีอำนาจหรือสร้างอำนาจให้กับตนเองจึงพยายามหวงข้อมูลไว้ให้มากที่สุดเพื่อให้ตัวเองมีอำนาจต่อรองและให้ตัวเองมีความสำคัญทั้งนั้นจริง ๆ แล้วตัวเองอาจจะไม่มีความสำคัญอะไรเลยก็ได้ ดังนั้นข้อมูลอาจจะเป็นสิ่งเดียวที่ทำให้ตนเองมีอำนาจอยู่จึงต้องหวงเอาไว้
2. กลัวว่าจะมีงานเข้าหรือมีงานเพิ่มขึ้นเมื่อคนอื่นทราบว่าตนเองมีข้อมูล ความขี้เกียจที่จะต้องมีเนื้องานหรือความรับผิดชอบเพิ่มขึ้นหากคนอื่นหรือหน่วยงานอื่น ๆ ทราบว่าตนเองมีข้อมูลนั้น ทำให้พยายามปกปิดหรือไม่แสดงให้คนอื่นทราบว่าตนเองมีข้อมูล เพื่อให้ไม่ให้ตนเองต้องรับผิดชอบงานเพิ่มขึ้นพูดง่าย ๆ ว่าหวงข้อมูลเพราะขี้เกียจทำงาน
3. หวงข้อมูลเพราะไม่อยากให้คนอื่นได้ดี ข้อมูลเปรียบเสมือนเพชรพลอยดิบยังไม่งดงามอะไรต้องการช่างเจียระไนที่มีฝีมือดีตัดและเจียระไนให้เหลี่ยมคมมันเงาของอัญมณีได้ฉายแสงออกมาเจิดจ้า หากตนเองเป็นผู้ครอบครองสินแร่มีค่าดังกล่าวแต่ไม่สามารถจะลงมือทำให้กลายเป็นเครื่องประดับอันงดงามควรค่าได้แล้ว เมื่อข้าไม่ได้ดีเอ็งก็ไม่ควรจะได้ดีด้วย การหวงข้อมูลจึงเป็นการขัดแข้งขัดขาป้องกันไม่ให้คนอื่นในหน่วยงานได้หน้าได้ตามากไปกว่าตนเองเพราะไม่อยากให้คนอื่นได้ดีโดยปราศจากความคิดและจิตสำนึกที่ว่าหน่วยงานของตนเองในภาพรวมหรือประเทศชาติจะได้รับประโยชน์อะไรไม่สนใจทั้งนั้นสนใจแต่ประโยชน์หน้าตาและตำแหน่งของตนเอง
4. กลัวว่าข้อมูลที่ถูกเอาไปใช้ จะมีผลการวิเคราะห์ที่ไม่ส่งผลดีต่อตัวเอง เช่น ชี้ให้เห็นข้อบกพร่องในการทำงานของตัวเอง เป็นการกลัวการตรวจสอบ เคยเห็นธนาคารแห่งหนึ่งตั้งแผนก data science มาแล้วแผนก data science นี้ก็ไปขอข้อมูลจากแผนกต่างๆ มาวิเคราะห์ และเริ่มตั้งต้นวิพากษ์วิจารณ์ข้อบกพร่องในการทำงานของแผนกต่าง ๆ ในบริษัท ทำให้เกิดการต่อต้านอย่างรุนแรงในหน่วยงาน วิธีที่ง่ายสุดคือการโต้เถียงว่าแผนก data science ไม่ได้มีความรู้หน้างานเรื่องธุรกิจนั้น ๆ และเมื่อแผนก data science มาขอข้อมูลอีกก็ถูกต่อต้านอย่างรุนแรง ไม่ได้รับความร่วมมือ ไม่ได้ข้อมูลอีกต่อไป เพราะทุกคนต่างเข็ดขยาดกับแผนก data science ซึ่งวิธีการนี้ผมก็ไม่ได้เห็นด้วย สร้างแต่ความร้าวฉานแตกแยก และไม่ได้ทำให้เกิดการเปลี่ยนแปลงในทางที่ดีแต่อย่างใด
5. หวงข้อมูลเพราะไม่มีความรู้เพียงพอที่จะวิเคราะห์ข้อมูลและไม่มีความรู้เพียงพอที่จะนำข้อมูลไปใช้อะไรอีกต่อไป ส่วนหนึ่งเป็นเพราะไม่ทราบจริง ๆ อีกส่วนหนึ่งอาจจะเป็นอวิชาก็ได้ ความไม่รู้นี้ทำให้ไม่เห็นความสำคัญของข้อมูลหรือสิ่งที่ตนเองดูแลอยู่หรือในอีกด้านอาจจะไม่ต้องการเสียหน้าเพราะไม่ต่างกันให้คนอื่นทราบว่าตนเองทำอะไรไม่ได้หรือไม่มีน้ำยาจะทำอะไร หมาหวงก้างที่แท้จริงเป็นเช่นนี้ เพราะไม่มีน้ำยาจะนำข้อมูลไปทำอะไรต่อให้เกิดประโยชน์นั่นเอง
6. ข้อมูลทำให้เกิดการตรวจสอบและความโปร่งใส หลายครั้งหากเปิดข้อมูลออกมาดูจะพบความบกพร่องตลอดจนความไม่ซื่อสัตย์สุจริตของการทำงานในหน่วยงาน และนำไปสู่การตรวจสอบหรือการลงโทษได้ การหวงข้อมูลไว้จึงไม่ใช่แค่การรักษาอำนาจ แต่เป็นการปกปิดความผิดของตนเองหรือเป็นการเอาขยะไปซุกไว้ใต้พรมเพื่อให้ตัวเองและหน่วยงานอยู่รอดปลอดภัยไปได้โดยตลอดกาล แต่ประเทศชาติไม่ได้ดีขึ้นหรือพัฒนาขึ้นแต่อย่างไร เล่นการเมืองไปวัน ๆ เพื่อให้ตัวเองได้ดี
7. ไม่มีข้อมูลครบถ้วน อาจจะกระท่อนกระแท่นหรือไม่ได้จัดเก็บข้อมูลไว้อย่างเป็นระบบ หน่วยงานต่าง ๆ มักละเลยการเก็บข้อมูล แม้ทุกข้อมูลมีเจ้าของแต่ไม่มีใครที่จะใส่ใจกำกับดูแลให้ข้อมูลมีคุณภาพเพียงพอ (Data Governance) ไม่เคยตรวจสอบคุณภาพข้อมูล (Data quality audit) การบันทึกข้อมูลจึงทำไปอย่างกระท่อน กระแท่นหรือทำไปอย่างผิดพลาดบกพร่องเป็นจำนวนมาก ถ้าเป็นในทางราชการก็เท่ากับเป็นการละเว้นการปฏิบัติหน้าที่หรือบกพร่องในการปฏิบัติหน้าที่ก่อให้เกิดความเสียหายร้ายแรงแก่รัฐได้ อันเป็นความผิดตามประมวลกฎหมายอาญา
ถ้าเป็นบริษัทก็ทำให้กิจการเกิดความเสียหายได้เช่นเดียวกัน การไม่เปิดเผยข้อมูลหรือส่งข้อมูลไว้ในกรณีนี้จึงเป็นปัญหาที่เกิดจากความกลัว รัฐบาลในบางประเทศถึงกับออกกฎหมายมีใจความว่ามีข้อมูลที่เลวย่อมดีกว่าการไม่มีข้อมูลเลยเพื่อให้หน่วยงานต่าง ๆ เปิดเผยข้อมูลออกมา เรียกว่า Bad data is better than no data.
8. หวงข้อมูลเพราะข้อมูลเหล่านั้นไม่ได้มีตัวตนอยู่จริง เป็นแค่การเมคข้อมูลขึ้นมาให้เป็นผลงานของตนเองหรือหน่วยงาน หากเป็นหน่วยราชการก็จะเป็นความผิดทางอาญา ปลอมแปลงเอกสารเท็จของทางราชการ ถ้าเป็นเอกชนก็สอบสวนกัน หากเป็นการทุจริตให้ได้เงินผลตอบแทนหรือผลงานก็ถึงขั้นไล่ออกได้ โปรดอ่านบทความ เมื่อข้าราชการต้องทราบจำนวนนกบนฟ้า ปลาในน้ำ และช้างในป่า ปัญหาสถิติทางการของประเทศไทย
9. กลัวการรักษาความปลอดภัยของข้อมูล โดยเฉพาะข้อมูลส่วนบุคคล เช่น ชื่อ ที่อยู่ เบอร์โทรศัพท์ อีเมล์ รายได้ ของแต่ละคนในฐานข้อมูล หากหลุดรอดออกไปและมีคนนำไปใช้ประโยชน์ก็จะเกิดความเสียหายได้ Facebook และโรงแรมในเครือ Marriott เพิ่งถูกฟ้องร้องและแพ้คดีเรื่องนี้ ต้องจ่ายค่าเสียหายมูลค่าสูงมาก ในประเทศไทยก็เพิ่งมีการออกพระราชบัญญัติคุ้มครองข้อมูลส่วนบุคคล 2562 และมีบทลงโทษเช่นนี้เช่นเดียวกันทำให้คนเริ่มกลัว และเริ่มหวงข้อมูลมากขึ้น
สำหรับเหตุผลข้อ 1-4 อาจจะกล่าวได้ว่าเป็นปัญหาการเมืองภายในองค์การ ต้องแก้ไขให้ทุกคนในองค์การมีความสมัครสมานสามัคคีมีน้ำหนึ่งใจเดียวกัน มีความไว้เนื้อเชื่อใจกัน มีความเสียสละเพื่อส่วนรวม เห็นแก่ประโยชน์ของส่วนรวมมากกว่าของตนเอง ถ้ารวมคนเห็นแก่ตัวเห็นแก่ได้ มักใหญ่ใฝ่สูง เอาดีใส่ตัว เอาชั่วใส่คนอื่น มีจิตใจอิจฉาริษยา ไม่อยากให้ใครได้ดีกว่าตัวเองมาทำงานในองค์การด้วยกันแล้ว เหตุผลของการหวงข้อมูลในข้อ 1-4 นี้ก็ไม่อาจจะแก้ไขได้
สำหรับเหตุผลข้อ 5 เป็นเรื่องของการขาดทักษะ ความรู้ ความสามารถ ไม่มีความแตกฉานด้านข้อมูล (Data literacy) ซึ่งพัฒนาได้ หากมีการเรียนรู้อย่างจริงจัง มีการโค้ช และให้ได้ทำจริงผ่านโครงการต่าง ๆ ลงมือทำ และให้ทุกคนได้มีส่วนร่วม
สำหรับเหตุผลข้อ 6-8 เป็นเรื่องปัญหาทางจริยธรรมบวกกับความกลัวความผิด การให้อภัย ไม่เอาโทษ ให้ทุกคนมองในทางบวกว่าไม่มี perfect data บนโลกนี้ ทุกอย่างมีความผิดพลาดได้หมด ถ้าไม่ใช่การทุจริตก็ควรยกโทษให้ ทุกคนเริ่มต้นใหม่ได้ ไม่จ้องจับผิด มองไปข้างหน้า มุ่งมั่นแก้ไขในสิ่งผิด ทำให้ดีขึ้นเรื่อย ๆ ในทุกวัน เปลี่ยนทัศนคติและวัฒนธรรมองค์การจากการจ้องจับผิดกัน เป็นการคิดแก้ไขร่วมกัน สร้างสรรค์ไปข้างหน้าเพื่ออนาคต เปลี่ยนความคิดว่า แม้ว่าข้อมูลจะผิดพลาดไปบ้างก็ยังดีกว่าไม่มีข้อมูลอะไรเลย และทุกตัวแบบที่สร้างขึ้นต่างก็ผิดหมดแต่บางตัวแบบยังมีประโยชน์ (All models are wrong, but some are useful.) อันเป็นคำกล่าวของ Gertrude Box นักสถิติชื่อดังของโลก ต้องปรับวิธีคิดและค่านิยมร่วมกัน (Shared value)
สำหรับเหตุผลข้อ 9 เป็นปัญหาเรื่องความมั่นคงของสารสนเทศ (Information security) อาจจะต้องมีการปรับเพิ่มเสริมความรู้ความเข้าใจด้านดังกล่าวให้ดีมากขึ้น ทั้งในเชิงกฎหมาย เชิงข้อมูล และเชิงเทคโนโลยีสารสนเทศ เพื่อให้เกิดการปฏิบัติที่ถูกต้องตามที่ควรจะเป็น
หมาหวงก้างข้อมูล นั้นแก้ไขได้ เมื่อแก้ไขได้แล้วก็จะเป็นประโยชน์กับหน่วยงานและกับประเทศชาติ หากต้องการพัฒนาประเทศ จำเป็นต้องใช้ข้อมูล
ขอให้ทุกท่านตระหนักว่า พระบาทสมเด็จพระบรมชนกาธิเบศร มหาภูมิพลอดุลยเดช มหาราชบรมนาถบพิตร ทรงเห็นความสำคัญในการใช้ข้อมูลและสถิติในการพัฒนาประเทศเป็นอย่างยิ่ง ทำตามรอยเบื้องพระยุคลบาท เพื่อชาติไทยกันเถิดครับ