xs
xsm
sm
md
lg

Big Data กับการพยากรณ์อากาศ

เผยแพร่:   โดย: อาจารย์ ดร. อานนท์ ศักดิ์วรวิชญ์

ภาพจากเว็บไซต์กรมอุตุนิยมวิทยา www.tmd.go.th
อาจารย์ ดร.อานนท์ ศักดิ์วรวิชญ์
สาขาวิชา Business Analytics and Intelligence
สาขาวิชาวิทยาการประกันภัยและการบริหารความเสี่ยง
คณะสถิติประยุกต์ สถาบันบัณฑิตพัฒนบริหารศาสตร์


เราคนไทยไม่ค่อยสนใจเรื่องพยากรณ์อากาศมากนักเมื่อเทียบกับชาติตะวันตกซึ่งมีอากาศเปลี่ยนแปลงอย่างรุนแรงและรวดเร็ว ก่อนออกจากบ้านคนตะวันตกต้องเตรียมตัวให้พร้อมว่าจะรับมือกับอากาศร้อนจัด อากาศหนาวจัด พายุฝนรุนแรง เฮอริเคน ทอร์นาโด พายุหิมะ น้ำท่วมจากหิมะละลาย พายุลูกเห็บ หรือน้ำฝนเยือกแข็ง (Freezing rain) ซึ่งทำให้ถึงแก่ชีวิตได้ แต่ของไทยเรา สามฤดู ร้อน หนาว ฝน ไม่ได้แตกต่างกันมากนัก นานๆ เราจะกลัวน้ำท่วมกันสักที แต่มหาอุทกภัยใหญ่ในปี 2554 ทำให้เกิดความหวาดกลัวกันมาก มากจนระบายน้ำในเขื่อนออกไปจนแทบขอดอ่างเก็บน้ำ ครั้งนั้นเป็นหายนะภัยอย่างแท้จริง ทำให้บริษัทประกันวินาศภัยและบริษัทรับประกันภัยต่อ (Re-insurance) ถึงกับซวนเซ ส่วนหนึ่งเป็นปัญหาในการจัดการที่ไม่ยอมทำในสิ่งที่ควรทำตามที่ได้พยากรณ์อากาศไว้เนื่องจากเหตุผลทางการเมืองของนักการเมืองบางกลุ่มบางจำพวกและบางคนที่ได้ลาโลกนี้ไปแล้ว ผลจากมหาอุทกภัยครั้งนั้นทำให้เบี้ยประกันวินาศภัยของไทยหลายประการเพิ่มสูงขึ้น ว่ากันว่าส่วนหนึ่งเป็นผลมาจากปรากฏการณ์ La Niña ที่เกิดจากปฏิสัมพันธ์ระหว่างการหมุนเวียนของกระแสอากาศกับกระแสน้ำในมหาสมุทร จึงทำให้ฝนตกหนักมาก

แล้วเราก็เจอปัญหาความแห้งแล้ง El Niño หนักมาก แม้เข้าหน้าฝนนี้แล้วน้ำในเขื่อนหลักก็ยังพร่องมากอยู่ดี ไม่ว่าจะเขื่อนสิริกิติ์ เขื่อนภูมิพล เขื่อนป่าสักชลสิทธิ์ แต่หลายสำนักก็พยากรณ์ว่าประเทศไทยเราจะกลับมาเจอ La Niña อีกครั้งในปีนี้ เราคงพอจะเห็นได้จากน้ำท่วมในจีนตอนใต้ ในพม่า และในลาว

ความแม่นยำของการพยากรณ์อากาศนั้นสำคัญมาก ส่งผลต่อการวางแผนต่างๆ เพื่อรับมือกับสภาพอากาศ ไม่ว่าจะด้าน เศรษฐกิจ การเกษตร การจราจรขนส่ง ลอจิสติกส์ ไปจนถึงการป้องกันหายนะภัย และการระบาดของโรคต่างๆ ในทางวิทยาการข้อมูล (Data Sciences) และ Business Analytics นั้นมีสาขาหนึ่งคือ Predictive Analytics หรือการวิเคราะห์เชิงทำนาย การวิเคราะห์เชิงทำนายที่แม่นยำ จะนำไปสู่ การวิเคราะห์เชิงสั่งการ (Prescriptive Analytics) ที่เหมาะสม หากเราพยากรณ์อนาคตได้ล่วงหน้าแม่นยำมากเท่าใด เรายิ่งจัดการ สั่งการ วางแผน รองรับความเสี่ยงและทำให้การบริหารความเสี่ยง (Risk management) ทำได้ดีมากยิ่งขึ้น

ความยากของการพยากรณ์อากาศนั้นเกิดจากข้อมูลในการพยากรณ์อากาศมีความซับซ้อนมาก

ประการแรก ข้อมูลสำหรับการพยากรณ์อากาศ มีตัวแปรหลายตัวแปรมากและมีข้อมูลหลายชนิด ไม่ว่าจะเป็น ความเร็วลม ทิศทางลม อุณหภูมิ ความชื้นสัมพัทธ์ของอากาศ ปริมาณน้ำฝน ชนิดของก้อนเมฆ ความกดอากาศ ขนาดและความหนาของก้อนเมฆ ข้อมูลมีทั้งที่เป็นตัวเลข เป็นภาพถ่ายดาวเทียม เป็นภาพสามมิติ สำหรับข้อมูลทางกายภาพได้แก่ ความสูง ภูเขา ป่าไม้ แม่น้ำ ทะเล ล้วนแต่มีผลและมีความซับซ้อนทำให้การพยากรณ์ทำได้ยากมากขึ้นเพราะมีตัวแปรมากมาย

ประการที่สอง ความก้าวหน้าของ internet of things (IoTs) ทำให้มีข้อมูลใหลเข้ามามากขึ้น อุปกรณ์ตรวจจับอากาศมีมากขึ้น การสร้างสถานีตรวจจับอากาศทำได้ง่ายมากขึ้น และมีปริมาณข้อมูลมหาศาล

ประการที่สาม ข้อมูลสำหรับการพยากรณ์อากาศเป็นข้อมูลอนุกรมเวลา (Time-series data) และอาจจะเป็นข้อมูลแบบเรียลไทม์ ใหลเข้ามาอย่างต่อเนื่อง ในความเป็นข้อมูลอนุกรมเวลาของพยากรณ์อากาศ มีทั้งการเปลี่ยนแปลงที่วนลูปในหนึ่งวัน เช่น ตอนใกล้รุ่งอากาศมักจะเย็นสุดในวันนั้น และร้อนสุดๆ ในช่วงกลางวันที่พระอาทิตย์ตั้งฉากบนผิวโลก นอกจากนี้เรายังมีฤดูกาล (Seasonality) เช่น มีฤดูร้อน ฤดูฝน ฤดูหนาว ที่แม้จะผิดเพี้ยนไปบ้างแต่ก็ยังมี pattern อยู่ ส่วน El Niño หรือ La Niña ก็จะวนเวียนเกิดขึ้นเป็นวงจร (Cycle) ทุก 5-6 ปี แต่ก็ไม่แน่นอนว่าจะเกิดขึ้นทุกกี่ปีแน่นอน ข้อมูลอนุกรมเวลาเหล่านี้มีอัตตสหสัมพันธ์ (autocorrelation or serial correlation) หรือความสัมพันธ์กันอันเกิดจากเวลา สภาพอากาศในเวลาที่ผ่านมาไม่นานเช่นในวันเดียวกันน่าจะมีความคล้ายคลึงสัมพันธ์กับสภาพอากาศในปัจจุบันหรือในอีกวันสองวัน มากกว่าสภาพอากาศในอดีตที่ผ่านมาแล้วยาวนาน ซึ่งเราต่างก็รู้ดีว่าการพยากรณ์อนาคตอันใกล้ย่อมมีโอกาสแม่นยำมากกว่าอนาคตที่ไกลออกไปมากๆ

ประการที่สี่ ข้อมูลสำหรับการพยากรณ์อากาศเป็นข้อมูลเชิงพื้นที่ (Spatial data) ยกตัวอย่างง่ายๆ ประเทศไทยเราอาจจะมีจุดหรือสถานีตรวจสอบสภาพอากาศนับพันๆ สถานีและประเทศเพื่อนบ้านก็มีเช่นกัน กฎข้อที่หนึ่งของวิชาภูมิศาสตร์ (Geography) ซึ่งนำเสนอโดย Waldo R. Tobler นักภูมิศาสตร์ชื่อก้องโลกได้เสนอว่า "Everything is related to everything else, but near things are more related than distant things.”ซึ่งแปลได้ว่า ทุกสิ่งย่อมสัมพันธ์กันกับสิ่งอื่นๆ แต่สิ่งที่ใกล้กันกว่าย่อมสัมพันธ์กันมากกว่าสิ่งที่อยู่ห่างไกลกัน และกฎข้อที่สองของภูมิศาสตร์ที่ Waldo R. Tobler ได้นำเสนอนั้นกล่าวว่า “The phenomenon external to an area of interest affects what goes on inside" แปลได้ว่า ปรากฏการณ์ที่อยู่นอกพื้นที่ที่เราสนใจนั้นส่งผลกระทบต่อพื้นที่ที่เราสนใจภายใน ในกรณีนี้สภาพอากาศในพื้นที่ใกล้เคียงกันจะมีความสัมพันธ์เชิงพื้นที่ (Spatial correlation) หรือมีความคล้ายคลึงกันมากกว่า และเราคงไม่อาจจะเพิกเฉยต่อความสัมพันธ์ดังกล่าวในการพยากรณ์อากาศได้

ประการที่ห้า ทั้งความสัมพันธ์เชิงเวลาและเชิงพื้นที่สำหรับข้อมูลที่ใช้พยากรณ์อากาศ ทำให้เกิดข้อมูลขนาดใหญ่มากที่มีลักษณะพิเศษที่เรียกว่า ข้อมูลเชิงเวลาพื้นที่ (Spatiotemporal data) ซึ่งมีทั้งความสัมพันธ์อันเกิดจากเวลา (เวลาอันใกล้-ไกล) และพื้นที่ (ใกล้-ห่างไกล) ทำให้ความสัมพันธ์มีความซับซ้อนมาก

ประการที่หก ความสัมพันธ์ระหว่างตัวแปรจำนวนมากมายหลากหลายประเภทในการพยากรณ์อากาศมีความสัมพันธ์ที่ซับซ้อนหรือไม่ทราบรูปแบบความสัมพันธ์ที่แน่ชัด อาจจะเป็นเชิงเส้นตรงหรือเส้นโค้ง ตัวอย่างที่เราทราบกันดีคือ ปริมาณกับความดัน แปรผกผันตามกฎของ Boyle ในลักษณะของ hyperbolic function หรืออาจจะมีปฏิกิริยาร่วมกัน (Interaction or joint effect) ของตัวแปรหลายๆ ตัวพร้อมๆ กัน ทำให้การวิเคราะห์เชิงทำนายทำได้ยากขึ้น

ประการที่เจ็ด โลกมีการเปลี่ยนแปลงภูมิอากาศค่อนข้างรุนแรง (Global Climate Change) เช่น ปรากฏการณ์โลกร้อน (Global Warming) ทำให้รูปแบบความสัมพันธ์ของตัวแปรต่างๆ ในการพยากรณ์อากาศไม่ค่อยเหมือนในอดีต มีความแปรปรวนสูง มีความไม่แน่นอนสูง และแบบจำลองเชิงพยากรณ์ที่เคยใช้ได้ดีในอดีตหากเจอการเปลี่ยนแปลงอย่างรวดเร็วจะใช้ไม่ได้ดีเท่าที่ควร

จะเห็นได้ว่าการพยากรณ์อากาศเป็นการวิเคราะห์เชิงทำนายที่เป็นข้อมูลขนาดใหญ่ มีข้อมูลหลากหลายประเภท เป็นข้อมูลเรียลไทม์ เป็นข้อมูลอนุกรมเวลาและข้อมูลเชิงพื้นที่ มีความไม่แน่นอนจากการเปลี่ยนแปลงภูมิอากาศของโลกเอง ทำให้เป็นงานที่ท้าทายอย่างยิ่ง การพยากรณ์อากาศในปัจจุบันจึงไม่สามารถใช้คนคำนวณด้วยมือเปล่าได้ เพราะข้อมูลมีขนาดใหญ่ (Big Volume) มีความเร็วสูงเพราะเป็นข้อมูลแบบเรียลไทม์ (Big Velocity) มีความหลากหลายของข้อมูล (Big Variety) ต้องการอาศัย Supercomputing โดย Supercomputing และอาศัยความรู้ด้านการเรียนรู้ของเครื่องจักร (Machine learning) และปัญญาประดิษฐ์ (Artificial intelligence) ที่พยายามให้คอมพิวเตอร์ความเร็วสูงเรียนรู้จากข้อมูล จับ pattern ของข้อมูลและนำมาพยากรณ์ การคำนวณเหล่านี้มีราคาสูงมาก เครื่อง supercomputer นั้นมีราคาแพงมาก แต่ Software สำหรับการพยากรณ์นั้นมีราคาแพงยิ่งกว่า

ถึงแม้จะมีราคาแพงแต่ก็คุ้มค่าอย่างยิ่งหากมีการพยากรณ์ได้แม่นยำ สมัยที่ผมเรียนอยู่ที่มหานครนิวยอร์กนั้นเกิดพายุเฮอริเคนพัดเข้านครนิวยอร์ก ซึ่งเป็นเกาะ และมีแม่น้ำ Hudson River และ East River โอบล้อมรอบ ทั้งตลิ่งสองข้างก็เป็นผาหินสูง ทำให้เกิด Storm Surge ได้ง่ายมาก นิวยอร์กนั้นน้ำลึกและตลิ่งชันโดยธรรมชาติทำให้เป็นท่าเรือน้ำลึกที่ดีมากโดยธรรมชาติรังสรรค์ แต่ภูมิประเทศแบบนี้ทำให้อันตราย เพราะน้ำทะเลจะยกระดับสูงมาก นายกเทศมนตรีนครนิวยอร์กในขณะนั้นชื่อ Michael Bloomberg ประกาศอพยพคนออกนอก Manhattan เป็นล้านคน เพราะมีโอกาสที่จะเกิด Storm Surge ผมเองจำได้ว่าโกลาหลมาก แต่มีเวลาเตรียมตัวกันหลายวันเกือบหนึ่งสัปดาห์ เพื่ออพยพออก (Evacuation) พอเกิดเหตุการณ์จริง น้ำทะเลซัดเทยกระดับเข้ามากวาดรถ เข้าสู่ระบบรถไฟใต้ดิน เมืองครึ่งเมืองจมน้ำ และไม่มีไฟฟ้าใช้ วันรุ่งขึ้นเกิดหิมะตกลงซ้ำทั้งๆ ที่ไฟฟ้าดับเกินกว่าครึ่งเมือง ให้ความรู้สึกเหมือนกับภาพยนตร์เรื่อง Perfect Storm อย่างไม่น่าเชื่อ แต่ไม่มีใครได้รับบาดเจ็บหรือเสียชีวิตเลย เพราะการพยากรณ์อากาศในสหรัฐอเมริกาค่อนข้างแม่นยำ หากไม่มี supercomputing ที่ดีพอคงต้องมีคนเสียชีวิตหลายล้านคนอย่างแน่นอน

อันที่จริงการพยากรณ์ก็ไม่ได้จะถูกต้องเสมอไปก่อนหน้าเหตุการณ์ที่เล่าให้ฟังนี้ก็เคยมีเฮอริเคนตั้งท่าจะถล่มนครนิวยอร์กแบบเดียวกันกับที่เกิดขึ้นในภายหลังนี้ และพยากรณ์กันว่าจะเกิด Storm Surge เช่นกัน แต่ Hurricane ลูกนั้นกลับเหหัวหักขึ้นฝั่งที่ New Jersey และ Atlantic City ทำให้ไม่เกิด Storm Surge ที่นครนิวยอร์ก และทำให้นักข่าวจำนวนมากไปถาม Mike Bloomberg ซึ่งประกาศให้คนอพยพออกจาก Manhattan และริมน้ำหลายล้านคนเป็นการเตรียมการที่ “ตื่นตูม” และ “เกินกว่าเหตุ” หรือไม่ ทำให้ Mike Bloomberg ถึงกับฟิวส์ขาดตวาดใส่นักข่าวทันทีว่าถ้าเกิดตายเป็นเบือใครจะรับผิดชอบ คุณจะรับผิดชอบไหม ไม่มีอะไรที่เกินกว่าเหตุถ้าเป็นชีวิตของประชาชน ผมยังนึกเลยว่าถ้าเป็นประเทศไทยต้องมีคนไม่เชื่อและไม่ยอมอพยพตามที่เตือนอย่างแน่นอน และคงมีคนตายเป็นเบือ เพราะเมื่อเกิดมหาอุทกภัย คนไทยก็ยังอยู่กันกับน้ำท่วมได้เป็นเดือนๆ อย่างยากลำบากและไม่ยอมอพยพออกส่วนใหญ่เพราะห่วงบ้านกันนั่นเอง

ข้อมูลขนาดใหญ่ (big data) และการวิเคราะห์ข้อมูลขนาดใหญ่ (Big data analytic) นั้นมีประโยชน์อย่างมากกับชีวิตของเรา สำหรับการพยากรณ์อากาศนั้น Google เองก็ลงทุนเรื่องนี้ไปเป็นมูลค่าสูงมาก เพื่อให้การพยากรณ์อากาศมีความแม่นยำ สำหรับประเทศไทยเรานั้นหลายคนชอบบ่นกันว่าพยากรณ์อากาศของไทยไม่ค่อยแม่นยำ ไม่ค่อยตรงนัก ทำให้คนไม่ค่อยใส่ใจจะฟังเท่าที่ควร แม้ว่าทางกรมอุตุนิยมวิทยาจะมี supercomputer ที่ว่านี้แล้วเหมือนกันก็ตาม ปัญหาอาจจะมีจากข้อมูลของเรายังไม่ครบถ้วนเท่ากับต่างประเทศก็เป็นได้ เรื่องนี้อาจจะต้องมีการปรับปรุงกันต่อไปในอนาคตอันใกล้ ที่เราเห็นได้ชัดคือข้อมูลนี้สำคัญยิ่งต่อการชลประทานและน้ำคือหัวใจของประเทศเกษตรกรรมอย่างประเทศไทย ต้องมีข้อมูลที่ดี พยาการณ์ได้แม่นยำ จึงจะจัดการได้อย่างถูกต้องเหมาะสม แต่การพยากรณ์อากาศที่ดีแค่ไหน ก็คงพ่ายแพ้นักการเมืองชั่วสาระแนรักษาผลประโยชน์ที่สามารถแทรกแซงเรื่องที่ตัวเองไม่มีความรู้เลย มีแต่ผลประโยชน์จนเกิดหายนะได้เสมอมา
กำลังโหลดความคิดเห็น