อาจารย์ ดร. อานนท์ ศักดิ์วรวิชญ์
สาขาวิชาวิทยาการประกันภัยและการบริหารความเสี่ยง
สาขาวิชา Business Analytics and Intelligence
คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์
http://www.as.nida.ac.th/
สาขาวิชาวิทยาการประกันภัยและการบริหารความเสี่ยง
สาขาวิชา Business Analytics and Intelligence
คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์
http://www.as.nida.ac.th/
ไม่ว่าจะข้อมูลขนาดใหญ่ (Big Data) หรือวิเคราะห์ธุรกิจ (Business Analytics) และวิทยาการข้อมูล (Data Sciences) ต่างการเป็นการวิเคราะห์ข้อมูลเชิงปริมาณ โดยผสมผสานความรู้ทางสถิติ วิทยาการคอมพิวเตอร์ เทคโนโลยีสารสนเทศเข้ามาร่วมกัน เพื่อสร้างองค์ความรู้ใหม่ เน้นการวิเคราะห์ค้นหาบุกเบิกจากข้อมูล (Exploratory Data Analysis) ตามแนวคิดของจอห์น ตูกี้ (John Tukey) นักสถิติชื่อดังของโลก และทั้งหมดเป็นการวิเคราะห์เชิงปริมาณหรืออาจจะกล่าวได้ว่าเป็นการวิจัยเชิงปริมาณ โดยใช้ตัวเลข อาจจะมีการวิเคราะห์ข้อมูลเชิงตัวอักษรหรือรูปภาพ เช่น การทำเหมืองข้อมูลอักขระ (Text mining) จาก Twitter หรือการวิเคราะห์เสียง และอาศัยการนับเลขหรือการวิเคราะห์ตัวเลขอยู่เบื้องหลังเช่น การนับความถี่ เป็นต้น
แต่ท้ายที่สุดทุกวิธีการของทั้งสามศาสตร์คือ ข้อมูลขนาดใหญ่ (Big Data) หรือวิเคราะห์ธุรกิจ (Business Analytics) และวิทยาการข้อมูล (Data Sciences) ต่างการเป็นการวิเคราะห์ข้อมูลเชิงปริมาณอยู่ดี เพื่อค้นหารูปแบบ (Pattern) ต่างๆ ของข้อมูล เช่น ในตะกร้าของลูกค้าซื้อสินค้าอะไรคู่กับสินค้าอะไร แบ่งกลุ่มลูกค้าได้กี่กลุ่มตามรูปแบบที่เหมือนกัน คนสมัครบัตรเครดิตคนไหนมีแนวโน้มจะเบี้ยวหนี้ ลำดับของ DNA แบบไหนเกี่ยวข้องสัมพันธ์กับการเป็นโรคมะเร็ง พนักงานคนไหนมีแนวโน้มจะลาออกมากกว่ากัน จะจัดตารางการผลิตแบบไหนที่ลดเวลาเปล่าเปลืองได้มากที่สุดและมีต้นทุนถูกที่สุด และอื่นๆ อีกมาก
ทั้งหมดเป็นการค้นหารูปแบบ (Pattern Discovery) สร้างองค์ความรู้ใหม่ เพื่อเอาไปประยุกต์ใช้งาน แต่ทว่า pattern ก็คือ pattern ตัวเลขก็คือตัวเลข กราฟก็คือกราฟ มันไม่ได้บอกเหตุผลเบื้องหลัง ไม่ได้บอกว่าทำไมจึงเจอ pattern เช่นนั้น และ pattern เช่นนั้นมีเหตุผลหรือทฤษฎีใดอยู่เบื้องหลัง อธิบายได้อย่างไร เพราะอะไร
ในทางสถิติเรากลัวสหสัมพันธ์ปลอม (Spurious correlation) กันมาก เช่น ปริมาณการบริโภคเหล้าในจีน มีความสัมพันธ์กันทางบวกกับอัตราการเจริญเติบโตของ Gross Domestic Product ในประเทศสวีเดน ซึ่งมันไม่น่าจะมีเหตุผลที่จะสัมพันธ์กัน อาจจะเป็นโดยอ้อม เพราะเศรษฐกิจโลกโต เศรษฐกิจสวีเดนก็โตตาม เศรษฐกิจจีนก็โตตาม ดังนั้นเมื่อเศรษฐกิจโตคนก็กินเหล้ากันมาก แต่เหตุผลอ้อมโลกแบบนี้เป็นเรื่องของเหตุบังเอิญ (Coincident) ที่เกิดขึ้นตลอดเวลา ใน Harvard Business Review ถึงกับมีบทความให้นักธุรกิจและนักบริหารระมัดระวังเรื่องสหสัมพันธ์ปลอมๆ ดังกล่าวอย่างยิ่ง จำนวนยอดขายไอโฟนกับจำนวนคนตกบันไดตายมีความสัมพันธ์กันทางบวก จำนวนยอดขายรถยนต์ใหม่ในสหรัฐอเมริกามีความสัมพันธ์ทางลบกับ Universal Studio ที่เมือง Orlando ขอให้เข้าไปอ่านได้ที่ https://hbr.org/2015/06/beware-spurious-correlations
ทั้งนี้ค่าสหสัมพันธ์ (และ pattern) ต่างๆ ที่เราค้นพบอาจจะไม่ได้มีเหตุผลกันและกันเลย ดังที่นักสถิติพูดกันเสมอว่า Correlation does not imply causation. ความสัมพันธ์กันไม่ได้แปลว่ามันเป็นเหตุเป็นผลของกันและกันแต่ประการใด
ความสัมพันธ์ปลอมๆ ที่ว่านี้เป็นสิ่งที่เราพบเจอได้เสมอใน ข้อมูลขนาดใหญ่ (Big Data) หรือวิเคราะห์ธุรกิจ (Business Analytics) และวิทยาการข้อมูล (Data Sciences) และหลายครั้งเราก็ทึกทัก และไปแต่งเรื่องวาดภาพหรือทฤษฎีเอาเองว่ามันเป็นอย่างนั้นเพราะมันเป็นอย่างนี้มาก่อน โดยไม่มีองค์ความรู้เดิมหรือทฤษฎีในสาขาวิชาที่เราวิเคราะห์มารองรับ ดังนั้นคนทำงานทางข้อมูลขนาดใหญ่ (Big Data) หรือวิเคราะห์ธุรกิจ (Business Analytics) และวิทยาการข้อมูล (Data Sciences) ต้องมีองค์ความรู้ในสาขาวิชาที่ตัวเองไปวิเคราะห์ไม่เช่นนั้นจะเกิดการทึกทักเข้าใจผิดและนำไปใช้ผิดๆ ได้ง่าย
เมื่อ Elton Mayo บิดาแห่ง Human Relations Movement ทางการจัดการ ไปทดลองเรื่องแสงสว่างกับผลผลิตของคนงานในโรงงาน Hawthorne ซึ่งต้องทำงานละเอียดและหากมีแสงสว่างดีเพียงพอน่าจะทำให้ได้ผลผลิตดีขึ้นเพราะทำงานได้ง่ายขึ้น เขาทดลองหรี่ไฟในโรงงานแล้วสังเกตพบว่าผลผลิตของคนงานกลับเพิ่มขึ้นเรื่อยๆ สวนทางกับแสงไปจนหรือไฟเท่ากับแสงจันทร์กลางคืน คนงานในโรงงานก็ทำงานได้ผลผลิตเพิ่มขึ้นเรื่อยๆ สร้างความสงสัยผลการทดลองเชิงปริมาณให้กับ Elton Mayo มากมาย สุดท้ายเขาตัดสินใจหยุดการทดลอง และใช้วิธีวิจัยเชิงคุณภาพโดยการไปสัมภาษณ์เชิงลึก (In-depth interview) กับพนักงานเหล่านั้น ทำให้เขาได้รับทราบความคิดจิตใจของคนงานว่าภาคภูมิใจในตนเองที่มี Professor จาก Harvard มาสนใจการทำงานของพวกเขา อย่าลืมว่าในสังคมอเมริกันเมื่อปี 1930 นั้นศาสตราจารย์มหาวิทยาลัยจากฮาร์วาร์ดถือว่ามีเกียรติมาก และคนงานอาจจะเป็นอาชีพล่างๆ สุด ผลจากการวิจัยเชิงปริมาณในครั้งนั้นกลับไม่มีประโยชน์เท่ากับข้อมูลเชิงคุณภาพ การวิจัยเชิงคุณภาพ ที่ทำให้ Elton Mayo รู้ว่าคนไม่ใช่เครื่องจักรต้องการความรักและความเข้าใจ หากจะบริหารจัดการให้มีประสิทธิภาพต้องเข้าใจจิตใจของคนที่ทำงานด้วย ต้องมีมนุษยสัมพันธ์ที่ดีกับพนักงานและเพื่อนร่วมงาน
ปัญหาจากการวิเคราะห์ด้วยวิธีเชิงปริมาณแล้วเจอ pattern ต่างๆ แต่อธิบายไม่ได้ ไม่มีทฤษฎีใดๆ รองรับ นั้นเป็นปัญหามาก ใน Silicon Valley ที่ California สหรัฐอเมริกาต้องจาก Behavioral Scientist หรือผู้เชี่ยวชาญสาขาวิชาต่างๆ มาพิจารณา pattern ที่เกิดขึ้นและหาทางอธิบายให้ได้ว่าอะไรทำให้เราเจอผลเช่นนั้น เช่น financial analytics มักลงท้ายด้วยการหาผู้เชี่ยวชาญด้านการเงินเชิงพฤติกรรม (Behavioral finance) มาอธิบายพฤติกรรมของนักลงทุน และหลายครั้งลงท้ายด้วยการทำวิจัยเชิงคุณภาพเพื่อหาเหตุผลว่าทำไมจึงเป็นเช่นนั้น อาจจะใช้การสัมภาษณ์เชิงลึก (in-depth interview) หรือการสนทนากลุ่ม (Focus group discussion) เป็นวิธีการเก็บข้อมูล และใช้ทฤษฎีรากฐาน (Grounded theory) ซึ่งเป็นวิธีการวิเคราะห์ข้อมูลเชิงคุณภาพเพื่อสร้างทฤษฎีที่ใช้กันแพร่หลายในวิชาสังคมวิทยา
ทำไมเราถึงจำเป็นต้องเข้าใจเหตุผล? คำตอบคือ There is nothing so practical as good theory. ไม่มีอะไรที่จะเอาไปปฏิบัติได้จริงดีเท่ากับทฤษฎีที่ดี ทฤษฎีที่ดีทำให้เราพยากรณ์ได้ว่าจะเกิดอะไรขึ้น เพื่อเราพยากรณ์ได้ว่าจะเกิดอะไรขึ้นเราก็จะสามารถควบคุมและเปลี่ยนแปลงได้อย่างใจเราต้องการ
การวิเคราะห์ธุรกิจประเภทหนึ่งคือการวิเคราะตะกร้า (Market Basket Analysis) ที่พยายามหากฎความเชื่อมโยง (Association rule) ระหว่างสินค้าในตะกร้าของคนที่เข้ามาซื้อของในร้านค้า ว่า Stock Keeping Unit ใด สัมพันธ์กับ Stock Keeping Unit ใด ทำให้เราสามารถวางสินค้าใกล้กัน มีการบริหารพื้นที่ในร้าน (Space Management) ได้ดีขึ้น ขายสินค้าที่ควรต้องขายด้วยกันได้มากขึ้น ได้ยอดขายมากขึ้น ลูกค้าพอใจหาของในร้านได้ง่าย ยกตัวอย่างเช่น ในสหรัฐอเมริกา พบว่าสินค้าในร้านสะดวกซื้อหรือ Supermarket ที่มักจะซื้อคู่กันคือผ้าอ้อมกับเบียร์ ทำไมเมื่อขายเบียร์ถึงได้ขายผ้าอ้อมด้วย คำถามนี้น่าสนใจและเมื่อไปทำวิจัยเชิงคุณภาพทำให้พบว่าภรรยาใช้สามีที่กำลังจะออกไปซื้อเบียร์ให้ซื้อผ้าอ้อมติดมาให้ลูกด้วย ถ้ามีความรู้ความเข้าใจหรือมีทฤษฎีอธิบายจะช่วยให้เราทำการส่งเสริมการตลาด (Marketing Promotion) หรือสื่อสารการตลาด (Marketing Communication) ได้น่ารักขึ้น ได้ผลมากขึ้น เช่น ใช้เรื่องความสัมพันธ์ในครอบครัวเข้ามาเป็นประเด็นในการโฆษณาเป็นต้น
ผมเคยได้ยินมาว่าร้านสะดวกซื้อในประเทศไทยวิเคราะห์ตะกร้า (Market Basket Analysis) แล้วพบว่าถุงยางอนามัยเป็นสินค้าที่คนนิยมซื้อคู่กันกับยาอมแผ่นระงับกลิ่นปากหรือหมากฝรั่งในร้านสะดวกซื้อ หากเราจะจินตนาการเอาเองว่าจริงๆ ลูกค้าจะซื้อถุงยางอนามัยแต่แก้เก้อด้วยการหยิบยาอมแผ่นระงับกลิ่นปากหรือหมากฝรั่ง เราคงจะเล่าเรื่อง (Telling a story) ไปได้อีกล้านแปดเรื่อง แต่คงไม่มีวิธีใดที่จะเข้าใจได้ที่สุดหากไม่ไปทำวิจัยเชิงคุณภาพ ส่วนคำตอบคืออะไร ก็ต้องไปค้นคว้ากันต่อเองนะครับ
แต่ที่แน่ๆ ข้อมูลขนาดใหญ่ (Big Data) หรือวิเคราะห์ธุรกิจ (Business Analytics) และวิทยาการข้อมูล (Data Sciences) อาจจะต้องลงท้ายด้วยการทำวิจัยเชิงคุณภาพเพื่อให้เข้าใจเหตุผลและมั่นใจว่ารูปแบบของความรู้ที่พบเจอไม่ได้เป็นสหสัมพันธ์ปลอมๆ หรือรูปแบบที่เกิดจากความบังเอิญซึ่งหากนำไปใช้จริงอาจจะนำไปสู่ความล้มเหลวได้
ติดตาม Facebook ด้าน Business Analytics and Intelligence ได้ที่ https://www.facebook.com/BusinessAnalyticsNIDA/ และทาง Web Site ได้ที่ https://businessanalyticsnida.wordpress.com/