นักวิทยาศาสตร์ข้อมูล (Data scientist) เป็นอาชีพที่ต้องใช้ทักษะทั้งในด้านคณิตศาสตร์, สถิติ และการเขียนโปรแกรมคอมพิวเตอร์ ซึ่งต้องเป็นผู้จัดระเบียบข้อมูลขนาดใหญ่ ทั้งแบบที่มีโครงสร้างชัดเจนและแบบไม่มีโครงสร้างแบบแผนที่ชัดเจน จากนั้นก็ใช้การวิเคราะห์ด้วยเครื่องมือต่างๆ เพื่อให้ได้ผลลัพธ์ออกมาตามวัตถุประสงค์และเงื่อนไขที่ตั้งไว้
ในปัจจุบัน องค์กรต่างๆกำลังควานหาบุคคลากรที่มีค่าในสาขาที่เกี่ยวข้องกับการวิเคราะห์ข้อมูลขนาดใหญ่ (Big Data) ซึ่งนับวันจะหายากยิ่ง จนทำให้ Harvard Business Review ได้ออกมาชี้ว่า วิทยาศาสตร์ข้อมูล (Data science) คือ สาขาวิชาที่มีความ "Sexy" ที่สุดในศตวรรษที่ 21 “the sexiest job of the 21st century.”
นักวิทยาศาสตร์ข้อมูลเป็นบุคคลากรที่มีความเข้าใจในเรื่องสถิติมากกว่าวิศวกรซอฟต์แวร์ทั่วไป ซึ่งคุณสมบัติที่ต้องมีสำหรับนักวิทยาศาสตร์ข้อมูล มีดังนี้
- ทำการวิจัยและตั้งคำถามปลายเปิดเกี่ยวกับปัญหาด้านต่างๆ เช่น ปัญหาการบริหารจัดการภาครัฐ, ปัญหาสาธารณะ, ปัญหาเชิงธุรกิจ
- ย่อยข้อมูลปริมาณมหาศาลจากแหล่งข้อมูลทั้งภายในและภายนอกองค์กร
- ใช้โปรแกรมการวิเคราะห์ที่ซับซ้อน, machine learning และวิธีทางสถิติเพื่อเตรียมข้อมูลสำหรับใช้ในการคาดการณ์
- จัดระเบียบข้อมูลเพื่อลบหรือกำจัดข้อมูลที่ไม่เกี่ยวข้อง (ข้อมูลขยะ)
- สำรวจและตรวจสอบข้อมูลจากหลากหลายมุมเพื่อหาจุดอ่อนแนวโน้มและ/หรือโอกาสที่ซ่อนอยู่
- คิดค้นวิธีการแก้ปัญหา (solution) ที่ขับเคลื่อนด้วยข้อมูล
- สร้างอัลกอริทึมใหม่เพื่อแก้ปัญหาและสร้างเครื่องมือใหม่ ๆ เพื่อทำงานโดยอัตโนมัติ
- สื่อสารการคาดการณ์และประเด็นใหม่ๆที่ค้นพบกับฝ่ายบริหารและฝ่ายไอที ผ่านการสร้างภาพของข้อมูลและรายงานที่มีประสิทธิภาพที่เข้าใจง่าย
- ให้คำแนะนำการเปลี่ยนแปลงต่อกระบวนการและกลยุทธ์ที่มีประสิทธิภาพ
แต่ละองค์กรจะมีการแบ่งหน้าที่ที่แตกต่างกันไป บางแห่งปฏิบัติต่อนักวิทยาศาสตร์ข้อมูลในฐานะเป็นนักวิเคราะห์ข้อมูลหรืออาจรวมหน้าที่ไปกับวิศวกรข้อมูลด้วย และบางแห่งต้องการผู้เชี่ยวชาญด้านการวิเคราะห์ระดับสูงที่เชี่ยวชาญในด้าน machine learning และการสร้างภาพของข้อมูลโดยเฉพาะ
แม้ว่านักวิทยาศาสตร์ข้อมูล จะเป็นบุคคลที่โลกกำลังแสวงหาพวกเขา แต่พวกเขาก็ต้องประสบกับการเปลี่ยนแปลงของเทคโนโลยีที่รวดเร็วแบบ super-exponential ดังนั้นทำให้พวกเขาต้องตื่นตัวและพร้อมเปิดรับแนวคิดและวิธีการในการวิเคราะห์ใหม่ๆ เสมอ
นักวิทยาศาสตร์ข้อมูลมักจะต้องเข้าร่วมการทำงานในหลายโครงการพร้อมกัน และเมื่อทำโครงการถึง 90% จนโครงการสามารถวิ่งต่อไปได้แล้ว ก็มักจะต้องย้ายไปทำโครงการใหม่ๆ ต่อไป
นักวิทยาศาสตร์ข้อมูลมีผลต่อความสำเร็จโดยรวมขององค์กรเป็นอย่างมาก เพราะในฐานะนักวิทยาศาสตร์ข้อมูล พวกเขาจะต้องเข้าไปมีส่วนร่วมกับวิศวกรและบุคคลากรอื่นๆ ในทุกขั้นตอนของการออกแบบผลิตภัณฑ์ การวิจัยและวางกลยุทธ์ที่ต้องใช้ข้อมูลเพื่อระบุสิ่งที่องค์กรควรจะลงทุน ไปจนถึงการออกแบบการทดลองเพื่อหาวิธีการประเมินผลกระทบของผลิตภัณฑ์ และแน่นอน เราสามารถเห็นได้ชัดว่านักวิทยาศาสตร์ข้อมูลมีผลต่อองค์กรมากขนาดไหน
นักวิทยาศาสตร์ข้อมูลต้องมีทักษะการเขียนโปรแกรมเพื่อการสืบค้นข้อมูลและสร้างตารางความสัมพันธ์ อีกทั้งยังต้องมีทักษะการเขียนโปรแกรมเพื่อใช้ในการวิเคราะห์และสร้างโมเดล โดยมีแนวโน้มที่พวกเขาจะต้องมีทักษะในด้านการสร้างโมเดลในลักษณะ AI และ machine learning ซึ่งจะทำให้งานของพวกเขาชาญฉลาดและมีประสิทธิภาพมากขึ้น
นักวิทยาศาสตร์ข้อมูลที่ประสบความสำเร็จนั้นจะต้องมีพื้นฐานทางเทคนิคที่แข็งแกร่ง แต่นักวิทยาศาสตร์ข้อมูลที่ดีที่สุดนั้น จะต้องเป็นคนที่มีสัญชาตญาณที่ยอดเยี่ยมเกี่ยวกับโมเดลของข้อมูล เช่น โมเดลอะไรที่จะนำมาใช้ในสถานการณ์ที่แตกต่าง และจะต้องรู้ว่าเมื่อสิ่งแวดล้อมเปลี่ยนไปพวกเขาจะต้องเปลี่ยนโมเดลให้สอดคล้องเพื่อให้เกิดความแม่นยำในการพยากรณ์อีกด้วย
คำแนะนำเพื่อเตรียมพร้อมสำหรับตำแหน่งนักวิทยาศาสตร์ข้อมูล นอกเหนือจากการเรียนหลักสูตรด้านคณิตศาสตร์ การเขียนโปรแกรมคอมพิวเตอร์และวิชาสถิติแล้ว ควรทำทุกอย่างที่ให้ได้ทำงานกับข้อมูลจริง ถ้าคุณไม่มีเวลาฝึกงาน ควรลงทะเบียนสมัครเข้าร่วม hackathons (ดูความหมายที่ reference) หรือเสนอตัวเพื่อช่วยเหลือธุรกิจสตาร์ทอัพในด้านขัอมูล ซึ่งจะเป็นวิธีการที่ดีกว่าการเรียนในห้องเรียนอย่างเดียว
อ้างอิงข้อมูลจาก
[1] https://hbr.org/2012/10/data-scientist-the-sexiest-job-of-the-21st-century
[2] https://www.forbes.com/sites/drewhansen/2016/10/21/become-data-scientist/?s=trending#4ed83fe387d3
[3] hackathon : https://en.m.wikipedia.org/wiki/Hackathon