เปิดเบื้องหลังการทำงานโปรเจกต์ยักษ์ "ดีแทค-จุฬาฯ-บุญมีแล็บ" ที่จะฉายภาพความร่วมมือระหว่างโมบายโอเปอเรเตอร์ มหาวิทยาลัย และผู้เชี่ยวชาญด้านข้อมูล เพื่อผนึกกำลังวิเคราะห์บิ๊กดาต้าสำหรับเสริมการท่องเที่ยวไทย และสนับสนุนการพัฒนาสังคม ถือเป็นกรณีศึกษาชั้นยอดของการวิเคราะห์ Mobility data สู่ Tapping the Untapped และโมเดล Co-Lab ที่ต่อยอดสู่การใช้ข้อมูลเพื่อการพัฒนาสังคมไทยเต็มรูปแบบ
อรอุมา ฤกษ์พัฒนาพิพัฒน์ ผู้อำนวยการอาวุโส สายงานสื่อสารองค์กรและความยั่งยืนของดีแทค เล่าถึงที่มาที่ไปของโครงการศึกษารูปแบบการเคลื่อนที่และการกระจุกตัวของนักท่องเที่ยวไทยในสถานการณ์การแพร่ระบาดของโรคโควิด-19 ผ่านข้อมูลการเคลื่อนที่ (mobility data) ว่า โครงการฯ นี้เกิดขึ้นมาจากความเชื่อในพลังของดาต้า รวมถึงความเชื่อในอุตสาหกรรมโทรคมนาคมที่ถือเป็น enabler ที่สำคัญ เพราะเป็นหนึ่งในไม่กี่อุตสาหกรรมที่มีฐานข้อมูลลูกค้าอยู่ในความดูแลขนาดมหาศาล จากเดิมที่มีการพูดคุยกันในการทำวิจัยในระดับจังหวัด แต่เมื่อขยายผลให้เห็นถึงศักยภาพของ mobility data ผู้เกี่ยวข้องทั้ง 3 ฝ่าย จึงได้เห็นชอบในการวิจัยระดับประเทศ
"ที่ผ่านมา เราเห็นยูสเคสจากใช้ประโยชน์จากดาต้าเชิงพาณิชย์อย่างแพร่หลาย แต่จะดีกว่าไหม ถ้าเราสามารถดึงผู้เชี่ยวชาญในสาขาต่างๆ มาจับมือกันเพื่อแก้ไขปัญหาสังคม และโครงการฯ นี้จึงเกิดขึ้นจากการนั่งคุยเพียง 1 ชั่วโมงระหว่างดีแทค อ.อั๋น (ผศ.ดร.ณัฐพงศ์ พันธ์น้อย) จากคณะสถาปัตย์ จุฬาฯ และคุณโจ้ (ธิติพงษ์ เหลืองอรุณเลิศ ซีอีโอของบุญมีแล็บ)"
ข้อมูลมหาศาลนับหมื่นล้านชุด
กว่าโปรเจกต์นี้จะเกิดขึ้นไม่ใช่เรื่องง่ายและกินเวลาทั้งสิ้นเกือบ 2 ปี โดยขั้นตอนที่ใช้เวลายาวนานที่สุดคือ การพิจารณาความเสี่ยงจากการใช้ประโยชน์ของข้อมูลเพื่อการวิจัยจากผู้มีส่วนเกี่ยวข้องที่กินเวลาราว 1 ปีครึ่ง โดยประกอบด้วยขั้นตอนการสอบทานธุรกิจ (Business Partner Due Diligence) ลงนามเห็นชอบในสัญญารักษาความลับ (Non-disclosure agreement) หนังสือบันทึกข้อตกลงระหว่างองค์กร (MoU) และสัญญาการเก็บ ใช้และประมวลผลข้อมูล (Data Processing Agreement)
นอกจากนี้ ยังต้องผ่านการประเมินผลกระทบด้านการคุ้มครองข้อมูลส่วนบุคคลจากคณะกรรมการภายใน (Dara Privacy Risks & Impact Assessment) อีกด้วย เนื่องจากจัดเป็นประเด็นอ่อนไหว เกี่ยวข้องกับความเป็นส่วนตัวของลูกค้า ทั้งนี้ ดีแทคจึงต้องตรวจสอบให้มั่นใจว่าโครงการนี้เป็นชุดข้อมูลที่ไม่สามารถระบุตัวตนของผู้ใช้งานได้ทั้งทางตรงและทางอ้อม ภายใต้การกำกับและดูแลนโยบายข้อมูลส่วนบุคคลและความปลอดภัยทางไซเบอร์ที่เข้มงวดของดีแทค
อย่างไรก็ตาม ด้วยความเชื่ออันแรงกล้าของทีมงาน ทุกฝ่ายได้ฝ่าฟันอุปสรรคนานัปการ โดยปฏิบัติตามเงื่อนไขที่ว่า ข้อมูลจะเป็นแบบไม่เฉพาะเจาะจงและถูกทำให้ไม่สามารถระบุตัวตนได้ (Aggregate and anonymized data) ชุดข้อมูลที่ทำการวิจัยเป็นชุดข้อมูลที่ได้รับความยินยอมจากลูกค้าแล้วเท่านั้น ที่สำคัญ การวิเคราะห์ข้อมูลจะต้องดำเนินการในสถานที่แบบปิด ไม่สามารถเข้าถึงอินเทอร์เน็ตได้ โดยดีแทคได้อำนวยความสะดวกด้านสถานที่ไว้ที่ชั้น 31 ที่ดีแทคเฮาส์
วรวิมล ศรีนุต ผู้อำนวยการฝ่ายบริหารคุณค่าลูกค้าของดีแทค อีกหนึ่งบุคคลสำคัญที่ทำหน้าที่สร้างความมั่นใจว่าข้อมูลที่ทำการวิเคราะห์นั้นอยู่ภายใต้นโยบายข้อมูลส่วนบุคคลขั้นสูงสุด เล่าว่า ข้อมูลที่ถูกนำไปวิเคราะห์นี้ หรือที่เรียกว่า mobility data สามารถระบุช่วงเวลาการใช้งาน รูปแบบการใช้งาน รวมถึงตำแหน่งของการใช้งาน ซึ่งก่อนจะนำไปวิเคราะห์ ดีแทคได้ทำให้ข้อมูลไม่สามารถระบุตัวตน ผ่านเทคนิค Data anonymization (One-way Hashing with SHA-256) ทำให้ข้อมูลระหว่างเดือนมิถุนายน 2563 ถึงตุลาคม 2564 ที่มีขนาดนับ “หมื่นล้านชุด” ถูกจัดทำให้อยู่ในระดับ “ตำบล” เมื่อทำการนิรนามข้อมูลและสุ่มกลุ่มตัวอย่างให้อยู่ปริมาณที่สามารถดำเนินการวิเคราะห์ได้อย่างมีประสิทธิภาพแล้ว จึงนำข้อมูลส่งต่อนักวิจัยผ่านโครงข่ายส่วนตัว (Private network) เพื่อนำไปวิเคราะห์ต่อไป
ความท้าทายในการจัดการข้อมูลขนาดใหญ่
ผศ.ดร.ภูริพันธุ์ รุจิขจร ผู้ร่วมก่อตั้ง และรพี สุวีรานนท์ CTO ของ Boonmee Lab เล่าว่า หลังจากได้ข้อมูลมาแล้ว ทาง อ.อั๋น ของคณะสถาปัตย์ จุฬาฯ จะทำหน้าที่เป็น Domain expert หรือผู้เชี่ยวชาญในสาขานั้นๆ โดยจะเป็นผู้ตั้งชุดคำถามและแนวทางการวิเคราะห์ข้อมูลขึ้นมาก่อน จากนั้นทาง Boonmee Lab จึงพิจารณาถึงการจัดการข้อมูลและหาความเป็นไปได้ในการตอบคำถามเหล่านั้น
ด้วยลักษณะเฉพาะของ Mobility data ที่แสดงถึงปริมาณการกระจุกตัวของการเดินทางแต่ละรูปแบบในแต่ละพื้นที่และในแต่ละช่วงเวลา ทำให้ข้อมูลที่ได้รับมาจากดีแทคมีความลื่นไหลในตัวเองสูง สามารถสร้างวิธีการจัดการข้อมูลได้หลากหลายรูปแบบ นั่นจึงทำให้ทีม Boonmee Lab และ อ.อั๋น ต้องทำงานร่วมกันอย่างใกล้ชิดเพื่อร่วมกันกำหนดนิยามจากการทบทวนวรรณกรรม ขั้นตอนการวิเคราะห์ การกำหนดดัชนีชี้วัด และการตีความผลการวิเคราะห์ เพื่อให้สามารถตอบคำถามที่ต้องการได้ ตัวอย่างเช่น นิยามของการเดินทางท่องเที่ยวจากข้อมูลชุดนี้ คือ การเดินทางออกจากจังหวัดที่เป็นถิ่นที่อยู่และสถานที่ทำงานไปสู่จังหวัดอื่นในวันหยุด
"เราจึงต้องมากำหนดเงื่อนไขในเชิงพื้นที่และเวลาเพื่อคัดเลือกเฉพาะข้อมูลการเดินทาง (ทริป) ที่ตรงกับนิยามการเดินทางท่องเที่ยว เพื่อให้มั่นใจว่าข้อมูลที่ใช้นั้นสะท้อนให้เห็นถึงการกระจุกตัวของการเดินทางท่องเที่ยวในพื้นที่นั้นจริงๆ ประกอบกับการวิเคราะห์ข้อมูลการกระจุกตัวเรากำหนดรายละเอียดลงไปถึงการกระจุกตัวของการเดินทางในระดับตำบล ซึ่งทำให้ทีม Boonmee Lab ต้องคิดหาวิธีการวิเคราะห์ข้อมูลขนาดใหญ่ที่มีประสิทธิภาพมากที่สุด"
การวิเคราะห์ในครั้งนี้มีระเบียบวิธีที่ต่างออกไปจากการใช้วิธีสำรวจการเดินทางของนักท่องเที่ยวโดยแบบสอบถามและการสัมภาษณ์ซึ่งเป็นการรวบรวมข้อมูลย้อนหลังโดยอาศัยข้อมูลจากความทรงจำของนักท่องเที่ยว เนื่องจากเป็นการวิเคราะห์ Mobility data จะสะท้อนรูปแบบและพฤติกรรมการเดินทางที่เกิดขึ้นจริงในแต่ละพื้นที่ นอกจากนั้น การวิเคราะห์ข้อมูลจึงสามารถดำเนินการได้หลากหลายรูปแบบจากลักษณะของคำถามที่ต้องการรู้และรูปแบบข้อมูลที่มีอยู่
“ในการทำงาน ทีม Boonmee Lab จะต้องวางแผนการทำงานที่มีความยืดหยุ่น เพื่อสามารถปรับเปลี่ยนวิธีการวิเคราะห์ข้อมูลให้เป็นไปตามนิยาม คำถาม และตัวแปรต่างๆ ได้อย่างเหมาะสม รวดเร็ว และถูกต้อง” ระพี กล่าว
ผศ.ดร.ภูริพันธุ์ อธิบายเสริมว่า ในการจัดการข้อมูลเพื่อใช้ในการวิเคราะห์นั้น ทาง Boonmee Lab จะไม่รู้ข้อมูลส่วนบุคคลของผู้ใช้งานเลย จะรับรู้เพียงแค่ข้อมูลการเดินทางที่จะแสดงจุดเริ่มต้นและจุดปลายทางของแต่ละชุดข้อมูลเท่านั้น ทั้งนี้ ข้อมูลที่ได้รับจากดีแทคเกิดจากการ “สุ่ม” กลุ่มตัวอย่างคิดเป็นสัดส่วนร้อยละ 10 ของบัญชีหมายเลขโทรศัพท์มือถือในเครือข่ายของดีแทคที่อนุญาตให้สามารถใช้ในการวิเคราะห์ข้อมูลได้ และเป็นบัญชีหมายเลขที่มีรูปแบบการเดินทางตรงตามนิยามการท่องเที่ยวที่กำหนดไว้ ซึ่งนับได้ว่าข้อมูลที่นำมาใช้ในโครงการมีจำนวนมากเพียงพอที่จะเป็น “กลุ่มตัวแทน” ของการเดินทางท่องเที่ยวตามหลักสถิติได้เป็นอย่างดี
Mobility data เป็นข้อมูลแบบ Hierarchy กล่าวคือ เป็นข้อมูลที่มีลำดับชั้นและสามารถวิเคราะห์ได้หลากหลายรูปแบบ โดยมีตัวแปรสำคัญเป็นเรื่องของสถานที่และเวลา ในเชิงสถานที่สามารถประมวลผลข้อมูลได้ทั้งในระดับภาค ระดับจังหวัด จนถึงระดับตำบล ขณะที่มิติด้านเวลาสามารถแบ่งข้อมูลออกเป็นช่วงเวลากลางวันและกลางคืน หรือช่วงเช้า บ่าย เย็น และค่ำในแต่ละวันก็ได้ Mobility data มีความแตกต่างจากข้อมูลที่เคยผ่านมือของ Boonmee Lab มาในอดีต ทั้งในแง่ปริมาณของข้อมูลที่มีขนาดใหญ่มาก รวมถึงการเป็นข้อมูลที่บันทึกสถานการณ์จริงโดยอัตโนมัติ ทั้งนี้ Mobility data นับเป็นข้อมูลที่มีความแม่นยำ สามารถจัดเก็บได้บ่อย และช่วยให้เข้าใจถึงรูปแบบการเดินทางได้เป็นอย่างดี ทีม Boonmee Lab จึงนำ Mobility data มาจัดการให้อยู่ในรูปแบบที่ทีมนักวิจัยจากคณะสถาปัตยกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย สามารถนำไปใช้วิเคราะห์ในเชิงพื้นที่ต่อได้ง่าย โดยจัดทำตารางแสดงข้อมูลที่บ่งชี้ถึงปริมาณการกระจุกตัวของการเดินทางแต่ละรูปแบบในแต่ละพื้นที่ตามช่วงเวลา
ระพี กล่าวเสริมว่า แม้การจัดการ Mobility data จะมีความซับซ้อนสูง แต่ทีมงานรู้สึกสนุกไปกับขั้นตอนการดำเนินการอย่างมาก เนื่องจากข้อมูลชุดนี้ช่วยให้เรามองเห็นรูปแบบของการเดินทางท่องเที่ยวในแต่ละพื้นที่ ซึ่งข้อมูลสะท้อนความหมายที่แตกต่างกันเมื่อเราเปลี่ยนแปลงตัวแปรในการวิเคราะห์ข้อมูล ไม่ว่าจะเป็นเวลา สถานที่ หรือรูปแบบการเดินทาง
ศักยภาพที่ซ่อนอยู่ของ Mobility data
ด้าน ผศ.ดร.ณัฐพงศ์ พันธ์น้อย อาจารย์ประจำภาควิชาการวางแผนภาคและเมือง และดำรงตำแหน่งเป็นรองผู้อำนวยการหน่วยปฏิบัติการวิจัยด้านการออกแบบเพื่อพัฒนาเศรษฐกิจสร้างสรรค์ (DCE) คณะสถาปัตยกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย อธิบายต่อว่า ทีมนักวิจัยจาก DCE ต้องทำการบ้านอย่างหนักและต้องประสานงานร่วมกับทีม Boonmee Lab อย่างใกล้ชิดเพื่อทำความเข้าใจลักษณะของข้อมูลและพิจารณาความเป็นไปได้ในการวิเคราะห์ค้นหาคำตอบภายใต้มาตรการการคุ้มครองข้อมูลส่วนบุคคล ในช่วงแรกทีมนักวิจัยได้จัดทำชุดคำถามที่น่าจะเป็นประโยชน์ต่อการพัฒนาการท่องเที่ยวและสามารถวิเคราะห์ได้จากข้อมูล Mobility data จากนั้นจึงนำข้อมูลที่ได้รับจากทีม Boonmee Lab มาวิเคราะห์ต่อโดยระบบภูมิสารสนเทศภูมิศาสตร์ (Geographic Information System; GIS) เพื่อทำให้เห็นข้อมูลการกระจุกตัวของการเดินทางท่องเที่ยวในเชิงพื้นที่อย่างชัดเจนมากยิ่งขึ้น ขั้นตอนนี้เรียกว่า scanning เพื่อคัดกรองว่าข้อมูลที่มีอยู่ทำให้เราเข้าใจสถานการณ์การท่องเที่ยวในประเด็นได้บ้าง เมื่อวิเคราะห์ข้อมูลจนได้ผลที่ชัดเจนในแต่ละมิติทั้งในด้านรูปแบบการเดินทางและปริมาณการกระจุกตัวในแต่ละสถานที่และช่วงเวลาแล้ว
ทีมนักวิจัยจากจุฬาลงกรณ์มหาวิทยาลัยจึงนำผลการวิเคราะห์มาพิจารณาค้นหาความหมาย (connect the dots) เพื่อพิจารณาถึงแนวทางการพัฒนาการท่องเที่ยวที่เหมาะสมกับในแต่ละพื้นที่
รองผู้อำนวยการหน่วยปฏิบัติการวิจัยด้านการออกแบบเพื่อพัฒนาเศรษฐกิจสร้างสรรค์อธิบายถึงความท้าทายในการทำงานว่า “ประเด็นสำคัญของการทำงานในขั้นตอนนี้ คือ ผู้วิจัยจะต้องเข้าใจทั้งลักษณะของ Mobility data และแนวทางการนำข้อมูลไปใช้ประโยชน์ จึงจะสามารถวางกรอบการวิเคราะห์ที่ชี้ให้เห็นศักยภาพและข้อจำกัดของการพัฒนาการท่องเที่ยวในแต่ละพื้นที่ได้อย่างชัดเจน”
ผศ.ดร.ณัฐพงศ์ อธิบายว่า Mobility data เปิดโอกาสให้เราทำความเข้าใจสถานการณ์ด้านการท่องเที่ยวได้อย่างละเอียด ชัดเจน และบูรณาการมากยิ่งขึ้น เราสามารถทราบถึงการกระจุกตัวของการเดินทางท่องเที่ยวทั้งในรูปแบบค้างคืนและไปกลับในแต่ละพื้นที่ได้อย่างชัดเจน โดยหน่วยการวิเคราะห์เชิงพื้นที่สามารถลงรายละเอียดได้ถึงระดับตำบล ในด้านช่วงเวลาเราสามารถทำความเข้าใจการเดินทางของนักท่องเที่ยวได้ถึงระดับรายชั่วโมงในแต่ละวัน ศักยภาพของ Mobility data ช่วยให้เราประเมินสถานการณ์และนโยบายด้านการท่องเที่ยวได้อย่างละเอียดและชัดเจนยิ่งขึ้น ตัวอย่างเช่น เราสามารถทราบได้ถึงขนาดที่ว่างานเทศกาลที่จัดขึ้นในพื้นที่หนึ่งสามารถทำให้เกิดการท่องเที่ยวแบบค้างคืนได้เพิ่มขึ้นมากน้อยเพียงใด หรือจังหวัดใดบ้างที่นักท่องเที่ยวเดินทางไปเที่ยวอย่างต่อเนื่องกันในการเดินทางหนึ่งครั้ง นอกจากนั้น ลักษณะเฉพาะของ Mobility data ที่มีตัวแปรประกอบด้วยรูปแบบการเดินทาง ปริมาณการกระจุกตัว ช่วงเวลา และสถานที่ ทำให้เราสามารถใช้ความคิดสร้างสรรค์ในการตั้งคำถามและคิดหาวิธีการวิเคราะห์ข้อมูลเพื่อทำความเข้าใจสถานการณ์การท่องเที่ยวในแต่ละพื้นที่ได้อย่างหลากหลาย ซึ่งจะเป็นประโยชน์ต่อหน่วยงานภาครัฐ ภาคเอกชน ชุมชน และสถาบันการศึกษาในการวางแผนการพัฒนาการท่องเที่ยว สินค้า และการบริการในแต่ละท้องถิ่นอย่างมีประสิทธิภาพ
“ด้วยศักยภาพของ Mobility data ทำให้ดีแทค Boonmee Lab และจุฬาลงกรณ์มหาวิทยาลัยตัดสินใจร่วมกันถึงการเผยแพร่ผลการศึกษาผ่านโครงการ Tapping the Untapped ซึ่งเป็นการนำเสนอมุมมองของการใช้ข้อมูลที่เราไม่เคยใช้งานให้เป็นประโยชน์มาก่อน เพื่อขยายโอกาสในการส่งเสริมการท่องเที่ยวในจังหวัดเมืองรอง เพื่อกระตุ้นการฟื้นตัวทางเศรษฐกิจและส่งเสริมการพัฒนาสังคมอย่างยั่งยืนไปยังท้องถิ่นต่างๆ ในประเทศไทย” ผศ.ดร.ณัฐพงศ์ กล่าว
โมเดล Co-Lab สู่การใช้ Mobility data เพื่อการพัฒนาสังคม
ผศ.ดร.ณัฐพงศ์ พันธ์น้อย เล่าเสริมถึงโมเดล Co-Lab ว่า การร่วมทำงานกันระหว่างบริษัทดีแทค ทีม Boonmee Lab และจุฬาลงกรณ์มหาวิทยาลัยในการวิเคราะห์ Mobility data เพื่อทำความเข้าใจสถานการณ์ด้านการท่องเที่ยวในครั้งนี้ชี้ให้เห็นว่าการนำ Mobility data ไปใช้ในการออกแบบนโยบายการพัฒนาสังคมจำเป็นอย่างยิ่งที่ต้องได้รับการสนับสนุนด้านข้อมูลและสถานที่ทำการวิเคราะห์จากบริษัทโทรคมนาคม รวมถึงต้องการการร่วมมือกันระหว่างบุคลากรด้านการวิเคราะห์ข้อมูล ผู้เชี่ยวชาญด้านการออกแบบนโยบาย และที่สำคัญ คือ หน่วยงานภาครัฐและภาคประชาสังคมที่ต้องการนำข้อมูลไปใช้ประโยชน์เพื่อการแก้ไขปัญหาและพัฒนาสังคมให้น่าอยู่มากยิ่งขึ้น การร่วมมือระหว่างภาคส่วนที่เกี่ยวข้องอย่างสร้างสรรค์เพื่อทำความเข้าใจสถานการณ์และออกแบบแนวทางการพัฒนาเป็นกลไกสำคัญในการผลักดันให้การใช้ Mobility data นำไปสู่การออกแบบนวัตกรรมเพื่อการพัฒนาสังคมอย่างยั่งยืน
อรอุมา ทิ้งท้ายว่า โมเดล Co-lab นี้ สามารถนำมาใช้กับปัญหาใหญ่อื่นๆ ที่ Mobility data สามารถเผยให้เห็น insights ที่สำคัญ เช่น การแก้ไขปัญหาด้านการจราจร การให้บริการสาธารณสุข การพัฒนาพื้นที่สาธารณะ การป้องกันโรคระบาด การบริหารจัดการในช่วงเกิดภัยพิบัติ เป็นต้น การร่วมงานกันครั้งนี้นำไปสู่การส่งเสริมฐานคิดใหม่ของการออกแบบนโยบายสาธารณะผ่านบิ๊กดาต้า เพื่อเพิ่มประสิทธิภาพและเปลี่ยนมุมมองการจัดทำนโยบายสาธารณะในรูปแบบใหม่ โดย Co-lab ช่วยเปิดโอกาสให้คนรุ่นใหม่ ผู้เชี่ยวชาญและผู้สนใจด้านดาต้า ได้มีโอกาสได้ใช้งาน Mobility data อย่างเต็มศักยภาพ
"เรามีความคาดหวังว่าโครงการนี้จะขยายศักยภาพไปสู่ความการเปลี่ยนแปลงประเทศเชิงโครงสร้างเลยทีเดียว และนี่คือแนวทางการพัฒนาที่ยั่งยืนของดีแทค ในการสร้างคุณค่าร่วมกับสังคมโดยอาศัยศักยภาพของการเป็นผู้ให้บริการโทรคมนาคม เพื่อประโยชน์สาธารณะ"