การสำรวจความคิดเห็นสาธารณะ (โพล) กับความคลาดเคลื่อนจากการชักตัวอย่าง

อานนท์ ศักดิ์วรวิชญ์
นักศึกษาปริญญาเอกทาง Psychometrics and quantiative psychology
Fordham University, New York City, USA

การสำรวจความคิดเห็นสาธารณะ (survey of public opinion) หรือการทำโพลกำลังเป็นที่แพร่หลายในประเทศไทย โดยเฉพาะช่วงใกล้การเลือกตั้งผู้ว่าราชการกรุงเทพมหานครนี้ มีโพลออกมาหลายสำนักมากมาย เราจะไม่พูดถึงปัจจัยทางการเมืองว่า โพลแต่ละสำนักไปเอาเงินทุนจากไหนมาสนับสนุน และการให้เงินสนับสนุนเหล่านั้นส่งผลต่อความน่าเชื่อถือของโพลอย่างไรบ้าง ซึ่งเป็นประเด็นที่หลายคนอาจจะสงสัย และมีความเป็นไปได้สูงว่าจะเป็นเรื่องจริง แต่เราไม่มีหลักฐานจะไปแสดง บทความชุดนี้จะทยอยนำเสนอปัญหาในการทำโพลไปทีละแง่มุม เพื่อให้ผู้อ่านได้เกิดความเข้าใจ และสามารถจะวิพากษ์วิจารณ์ผลของโพลเหล่านั้นได้ดีมากขึ้น

การทำโพลนั้นแท้จริงก็เป็นการสำรวจจากกลุ่มตัวอย่างเพื่อจะอนุมานไปยังประชากรที่เราสนใจจะศึกษายกตัวอย่างเช่น โพลผลการเลือกตั้งผู้ว่าฯ กทม.ประชากรก็คือประชาชนผู้มีสิทธิ์เลือกตั้งผู้ว่าฯ กทม.นี่แหละครับ แต่ประชาชนผู้มีสิทธิ์เลือกตั้งผู้ว่าฯ กทม.นั้นมีมากเหลือเกิน ถ้าจะเก็บข้อมูลจากทุกคนก็คงไปเสร็จ หลังเลือกตั้งและคงต้องใช้เงินมากเหลือเกิน ด้วยเหตุนี้จึงต้องมีการชักตัวอย่าง (Sampling) ซึ่งโดยหลักการก็ควร จะมีขนาดตัวอย่าง (Sample Size) หรือจำนวนคนที่สำรวจที่เพียงพอ ความคลาดเคลื่อนจากการชักตัวอย่าง (Sampling Error) จะได้ลดลงไปบ้าง เปรียบเสมือนภาพถ่ายที่มีจำนวน Pixel มากกับน้อย ภาพที่มีจำนวน Pixel มากก็จะมีความละเอียดมากกว่า คมชัดกว่าภาพที่มีจำนวน Pixel ต่ำๆ เช่น การทำโพลสำรวจการเลือกตั้งผู้ว่าฯ กทม.หากสำนักหนึ่งเก็บข้อมูลจากประชาชนใน กทม. 200 คน กับอีกสำนักหนึ่งเก็บข้อมูลจากประชาชน ในกทม.ผู้มีสิทธิ์เลือกตั้งจำนวน 20,000 คน โพลของสำนักหลังก็น่าจะมีความคลาดเคลื่อนน้อยกว่าแต่ไม่เสมอไป!

ในต่างประเทศการนำเสนอผลโพลจะมีการแสดงค่าความคลาดเคลื่อน หรือ Margin of Error ด้วยว่า มีค่าเป็นเท่าใด เช่น ผลสำรวจความเห็นที่มีต่อการทำแท้งพบว่า 50% เห็นด้วยและมี Margin of Error = ค่า Margin of Error นี้แสดงให้เห็นความคลาดเคลื่อนจากการสุ่ม ซึ่งหากขนาดตัวอย่างมีมากเพียงพอ ค่า Margin of Error จะมีค่าแคบๆ ไม่กว้างมาก ในเมืองไทยเท่าที่ได้อ่านผลโพลมายังแทบจะไม่เคยเห็นการนำเสนอค่า Margin of Error ที่ว่านี้ ซึ่งคำนวณโดยอาศัยวิธีการทางสถิติในการประมาณค่า

แต่นั้นยังไม่สำคัญเท่ากับเทคนิคในการชักตัวอย่าง (Sampling Technique) ในการชักตัวอย่างนั้น ควรต้องเป็นไปอย่างสุ่มๆ เรียกว่าเป็น Random Sampling ได้กลุ่มตัวอย่างที่ไม่เอนเอียง (Unbiased) และมีความเป็นตัวแทนของประชากร (Representativeness) ที่ดี เทียบง่ายๆ ว่า ส้มในเข่งที่ตลาดนั้น เรียงซ้อนๆ กันมาหลายๆ ชั้น แม่ค้าที่ไม่ซื่อสัตย์ส่วนใหญ่ก็มักจะคัดส้มลูกดีๆ ไว้ที่ชั้นบนสุดสองสามชั้นแล้วเอาลูกที่ไม่ดีใกล้เสียหรือมีตำหนิไว้ที่ชั้นล่างๆ ก้นเข่ง ถ้าเราจะซื้อส้ม เราก็อยากจะสุ่มดูว่าส้มเข่งที่เราจะซื้อมีคุณภาพ เป็น อย่างไร เราอาจจะหยิบส้มออกมาได้แค่ 20 ลูก จากในเข่งเป็นร้อยๆ ลูก ถ้าเราขี้เกียจเราก็เลือกหยิบแต่ส้มที่ชั้นบนสุดมาตรวจสอบดู เราก็จะพบว่าส้มเข่งนั้นคุณภาพดีทั้งเข่ง นี่ก็จะเป็นปัญหาเราก็จะโดนแม่ค้าส้มหลอกเราเอาได้

ในทางกลับกันถ้าเราจะยอมลำบาก รื้อส้มออกมาหรือเอามือล้วงลงไปในเข่งให้ลึกๆ มากที่สุด สุ่มส้มออกมาชั้นละลูกสองลูกไปจนก้นเข่ง เราก็มีโอกาสที่จะเห็นส้มไม่ดีที่แม่ค้าแอบซุกเอาไว้ชั้นล่างๆ แล้วเราก็ตัดสินใจได้ดีขึ้นว่าเราควรจะซื้อส้มเข่งนี้หรือไม่ ที่พูดอย่างนี้มันก็ไม่ใช่เรื่องง่ายในการล้วงลงไปในเข่งหรือรื้อเข่งส้ม เพราะแม่ค้าก็อาจจะไม่พอใจและว่าเอาได้ หรือไม่ยอมให้เราทำแบบนั้น แต่ก็ต้องทำถ้าอยากจะรู้ว่าส้มเข่งนั้นมันเป็นอย่างไรแน่ๆ

ฉันใดก็ฉันนั้นเทคนิคในการชักตัวอย่างในการทำโพลนั้นสำคัญอย่างยิ่งยวดต่อความน่าเชื่อถือของโพลมากกว่าขนาดตัวอย่างเสียอีก การส่งนักศึกษาออกไปเก็บข้อมูลจากคนเดินผ่านไปมาบนถนนให้ได้ครบตามจำนวน เรียกว่าเป็นการชักตัวอย่างแบบโควตา (Quota Sampling) ซึ่งไม่ได้ใช้ความน่าจะเป็นตามหลักการทางสถิติย่อมจะเป็นปัญหา นักศึกษาก็จะเลือกเก็บข้อมูลตามแต่คิดว่าจะสะดวก ซึ่งไม่น่าจะเป็นวิธีการที่ถูกต้อง โพลบางสำนักเลือกที่จะใช้การสำรวจจากอินเทอร์เน็ตเป็นหลักซึ่งก็จะไม่ครอบคลุมคนสูงอายุซึ่งมักจะเล่นอินเทอร์เน็ตหรือคอมพิวเตอร์เป็นน้อยกว่าคนอายุน้อยๆ แม้แต่การชักตัวอย่างโดยพื้นที่ (Area sampling) ถ้าไม่ได้วางแผนให้ดีก็อาจจะเกิดความเอนเอียงได้ เช่น โพลเก็บข้อมูลมาจากพื้นที่เขตกทม.ชั้นในมามากเกินไป มากเกินกว่าสัดส่วนประชากรในเขต กทม.ชั้นใน ก็อาจจะทำให้ผลโพลเอนเอียงมาทางคุณชายสุขุมพันธุ์ เพราะเขตกทม.ชั้นในเป็นฐานเสียงของพรรคประชาธิปัตย์

ในทางกลับกันถ้าไปเก็บข้อมูลมาจากพื้นที่แถวๆ กทม.ชั้นนอก เช่น มีนบุรี หนองจอก สะพานสูง คันนายาว เยอะมากเกินกว่าสัดส่วนประชากรในเขตนั้นๆ ผลโพลก็อาจจะออกมาว่า พงศพัศน่าจะชนะเลือกตั้งผู้ว่าฯ กทม.ในคราวนี้ เพราะเขตนั้นๆ มีฐานเสียงของพรรคเพื่อไทย

ในประเทศสหรัฐอเมริกามีตัวอย่างคลาสสิกที่แสดงให้เห็นความผิดพลาดในการทำโพลที่เกิดจากเทคนิคการชักตัวอย่างที่ไม่ถูกต้องตามหลักการทางสถิติ ในปี 1936 มีการเลือกตั้งประธานาธิบดีสหรัฐอเมริกา มีผู้ชิงตำแหน่งสองคน คนแรกคือแฟรงค์คลิน ดีลาโน รุสเวลท์ (Franklin Delano Roosevelt) จากพรรคเดโมแครต ส่วนอีกคนคือผู้สมัครจากพรรครีพับลิกันชื่ออาล์ฟ แลนดอน (Alf Landon) มีผลการทำโพลโดย “Literary Digest” ซึ่งเป็นนิตยสารรายสัปดาห์ที่มีชื่อเสียงในขณะนั้น ได้สำรวจโดยการส่งไปรษณียบัตรจำนวน 12 ล้านฉบับจากฐานข้อมูลผู้มีรถยนต์และผู้มีหลายเลขโทรศัพท์ในขนาดนั้นเป็นกรอบกำหนดการชักตัวอย่าง (Sampling frame) และมีอัตราการตอบกลับ (Response rate) เท่ากับ 21% หรือได้ไปรษณียบัตรตอบกลับมาราวๆ สองล้านเกือบสามล้านฉบับ ผลโพลของ “Literary Digest” แสดงว่า อาล์ฟ แลนดอน จากพรรครีพับลิกันชนะการเลือกตั้งขาดลอยน่าจะได้เป็นประธานาธิบดีอเมริกันคนที่ 32

ในขณะที่ผลการสำรวจโดย George Gallup ซึ่งเพิ่งตั้งบริษัทรับสำรวจความคิดเห็นสาธารณะขึ้นมาหมาดๆ มีกลุ่มตัวอย่างตอบกลับมาแค่ห้าหมื่นฉบับ แต่เทคนิคการชักตัวอย่างเป็นไปอย่างรอบคอบโดยหลักการทางสถิติและผลโพลพบว่า แฟรงค์คลิน ดีลาโน รุสเวลท์ ชนะเลือกตั้งอย่างขาดลอย และผลจาก Gallup poll ก็ตรงกับความเป็นจริง ประธานาธิบดีแฟรงค์คลิน ได้รับเลือกตั้งด้วยคะแนนนิยมท่วมท้นเป็นประวัติการณ์ และยังได้รับความนิยมจากประชาชนชาวอเมริกัน เป็นอย่างมากอย่างต่อเนื่อง โดยได้ดำรงตำแหน่งประธานาธิบดีติดต่อกันถึงสามสมัย นานที่สุดในประวัติศาสตร์สหรัฐอเมริกาเลยทีเดียว ส่วน George Gallup ก็คือคนที่ก่อตั้ง Gallup poll จนมีชื่อเสียงต่อเนื่องมาจนกระทั่งปัจจุบัน

คำถามคือจำนวนคนตอบกลับ Gallup แค่ห้าหมื่นทำไมจึงแม่นยำกว่าผลโพลของ Literary Digest ที่มีคนตอบกลับมาเกือบสามล้านคน เหตุผลง่ายๆ คือกรอบกำหนดการชักตัวอย่างของ Literary Digest นั้นแค่เริ่มต้นก็เอนเอียงเสียแล้ว ในยุคสมัยนั้นคนที่จะมีรถยนต์และโทรศัพท์ราคาแพงได้ มักจะเป็นคนมีฐานะทางเศรษฐกิจดี ซึ่งมักเป็นคนที่สนับสนุนพรรครีพับลิกัน นอกจากนี้คนที่เขียนตอบไปรษณียบัตรกลับมาด้วยตัวเอง ก็ต้องเป็นคนที่มีการศึกษาอ่านออกเขียนได้ดีพอสมควร แม้จนกระทั่งทุกวันนี้ระดับ การศึกษาและความสามารถในการอ่านออกเขียนได้ก็ยังเป็นปัญหาทำให้เกิดอคติที่ผู้ตอบแบบสอบถามจะเลือกที่จะตอบด้วยตนเอง (Self Selection Bias) กรอบกำหนดการชักตัวอย่างของ Literary Digest จึงถือว่าไม่เหมาะสม อย่างยิ่งเพราะไม่ได้มีความเป็นตัวแทนที่ดีของประชากรอเมริกันผู้มีสิทธิ์เลือกตั้งเลยแม้แต่น้อย แม้จะเก็บข้อมูลมาจากคนเป็นล้านๆ คน ก็ไม่มีความน่าเชื่อถือเท่าที่ควรเพราะข้อมูลได้มาโดยไม่ได้อาศัยหลักการทางสถิติอย่างรัดกุม

การทำโพลของผลการเลือกตั้งประธานาธิบดีอเมริกันครั้งล่าสุดนี้ก็ยังมีปัญหาเช่นกัน โพลแทบทุกสำนักไม่สามารถชี้ชัดไปได้ว่าประธานาธิบดีบารัค โอบามาจากพรรคเดโมแครตจะมีชัยชนะ นายมิตต์ รอมนีย์ ผู้ท้าชิงจากพรรครีพับลิกันแต่อย่างใด แต่เอาเข้าจริงประธานาธิบดีโอบามาชนะคะแนนอิเล็กทรอรอลโหวตอย่างท่วมท้นเหนือนายรอมนีย์ การทำโพลในสหรัฐอเมริกานั้นนิยมใช้โทรศัพท์บ้าน เป็นเครื่องมือในการสำรวจ แต่สิ่งที่น่าห่วงคือ ในปัจจุบันประชากรอเมริกันนิยมใช้โทรศัพท์บ้านลดลงไปมาก แต่ใช้โทรศัพท์เคลื่อนที่ค่อนข้างเยอะขึ้นมาก

นอกจากนี้คนที่ใช้โทรศัพท์เคลื่อนที่มักจะเป็นคนหนุ่มสาวรุ่นใหม่ๆ มากกว่าคนสูงอายุ แต่การทำโพลโดยสำรวจทางโทรศัพท์มือถือนั้นทำได้ค่อนข้างยากในสหรัฐอเมริกา เพราะคนมักไม่ให้ความร่วมมือในการตอบคำถาม ด้วยเหตุว่าในอเมริกาทั้งคนโทร.เข้าและคนรับสายโทรศัพท์เคลื่อนที่ต้องเสียค่าบริการทั้งสองฝั่ง ดังนั้นการสำรวจจากโทรศัพท์เคลื่อนที่จึงเป็นไปได้ยาก นอกจากนี้กฎหมายสหรัฐอเมริกายังห้ามใช้อุปกรณ์ในการโทร.อัตโนมัติเพื่อโทร.ออกไปยังโทรศัพท์มือถือ ทำให้ต้องโทร.ด้วยมือทีละคน ซึ่งทำให้ช้าและมีค่าใช้จ่ายค่อนข้างมาก

ปัญหาคือหากโพลต่างๆ ยังคงดำเนินการสำรวจด้วยการโทร.เข้าเฉพาะสายโทรศัพท์บ้านก็จะมีความคลาดเคลื่อนที่เกิดจากการไม่ครอบคลุมประชากร (Coverage Error) ในการสำรวจทำให้กลุ่มตัวอย่างที่ได้ขาดความเป็นตัวแทนที่ดีของประชากรอเมริกัน ดังที่มีคนคาดว่าคนหนุ่มสาวจำนวนมากเป็นพลังเงียบในการลง คะแนนให้ประธานาธิบดีโอบามาชนะการเลือกตั้งอย่างท่วมท้นในครั้งนี้

ที่เขียนมายืดยาวนี้ก็อยากให้ท่านทั้งหลายได้ลองพิจารณาวิธีการในการทำโพลของสำนักต่างๆ ในประเทศไทยให้รอบคอบก่อนที่จะเชื่อ หลายสำนักมักจะอ้างว่าดำเนินการโดยอ้างอิงหลักทางสถิติและการวิจัย แต่กลับไม่แสดงรายละเอียดว่ามีการดำเนินการชักตัวอย่างมาอย่างไร มักเขียนแบบคลุมเครือไม่ชัดแจ้ง ก็ขอให้ท่านคิดตรึกตรองให้รอบคอบก่อนที่จะเชื่อ ฉบับหน้าเราจะมาพูดถึงปัญหาอื่นๆ ของโพลอีกต่อไป เช่น ปัญหาที่เกิดจากตัวคำถาม การโกหกหรือตกแต่งคำตอบให้ดูดีของผู้ตอบ ปัญหาข้อมูลขาดหาย หรือคนไม่ร่วมมือในการตอบคำถาม ซึ่งยังมีรายละเอียดอีกมากและจะได้นำเสนอต่อไป