xs
xsm
sm
md
lg

เปิดภารกิจ AISG เอไอแห่งชาติสิงคโปร์ ร่วมมือ AWS พา SEA-LION เป็นยิ่งกว่า LLM

เผยแพร่:   ปรับปรุง:   โดย: ผู้จัดการออนไลน์



AI สิงคโปร์ ร่วมมือกับ AWS สร้างโมเดล Generative AI การันตีครอบคลุมประเทศในเอเชียตะวันออกเฉียงใต้ ยืนยันการเร่งพัฒนา Generative AI ควรทำแบบเจาะจงในแต่ละท้องถิ่น (Hyper-local)

ดร.เลสลี่ย์ เทียว ผู้อำนวยการอาวุโสฝ่ายผลิตภัณฑ์ AI ของ AISG กล่าวว่า การสร้าง LLM จำเป็นต้องมีโครงสร้างพื้นฐานระบบคลาวด์ที่เชื่อถือได้และพร้อมใช้งานทุกเมื่อ โดย AWS ช่วยให้ AISG สามารถปรับขนาดได้อย่างคุ้มค่า โดยได้สร้าง LLM ที่มีพารามิเตอร์ 3 พันล้านในเวลาเพียง 3 เดือนด้วย AWS และตั้งแต่นั้นมาได้ปรับขนาดโมเดลเป็น 7 พันล้านพารามิเตอร์ เพื่อขยายการเข้าถึงผู้คนมากขึ้น

"การทำงานร่วมกับ AWS ทำให้เราสามารถมุ่งเน้นไปที่การเทรนโมเดลของเราเพียงอย่างเดียวแทนที่จะต้องจัดการโครงสร้างพื้นฐาน ปัจจัยนี้จึงช่วยเร่งการพัฒนา LLM ที่เป็นเอกลักษณ์ และสะท้อนถึงความหลากหลายในภูมิภาคของเรา"

การวิเคราะห์แนวโน้มเทคโนโลยีในปี 2567 ของเวอร์เนอร์ โวเกลส์ (Werner Vogels) ซีทีโอของบริษัท Amazon ได้คาดการณ์ไว้ว่า Generative AI จะสามารถรับรู้ด้านวัฒนธรรมมากขึ้น โดยการเทรนโมเดลภาษาขนาดใหญ่ (Large language models: LLM) ซึ่งเป็นแขนงหนึ่งในหมวดหมู่ของเทคโนโลยีปัญญาประดิษฐ์ (Artificial intelligence: AI) ด้วยข้อมูลที่หลากหลาย จึงนำไปสู่ผลลัพธ์ที่ลึกซึ้งและแม่นยำยิ่งขึ้น เป้าหมายหลักคือการทำให้ Generative AI เข้าถึงผู้คนหลากหลายกลุ่มและเป็นประโยชน์แก่ผู้ใช้ทั่วโลก

อย่างไรก็ตาม LLM นั้นพึ่งพาข้อมูลที่ได้รับจากอินเทอร์เน็ต ซึ่งส่วนใหญ่มักเป็นในรูปแบบภาษาและอักษรที่ถูกใช้จำนวนมาก อย่างเช่นภาษาอังกฤษ ที่มีข้อมูลสำหรับการประมวลผลภาษาธรรมชาติ (Natural language processing: NLP) อยู่มากมาย สิ่งสำคัญที่องค์กรต่างๆ มองข้ามไม่ได้คือความสามารถในการดัดแปลง LLM ด้วยข้อมูลและภาษาท้องถิ่น เพื่อส่งเสริมความมีส่วนร่วมในสังคม กระตุ้นการเติบโตทางเศรษฐกิจด้วยการเปิดตลาดใหม่ๆ และสร้างประสบการณ์ที่ดียิ่งขึ้นให้กฝประชาชน

AISG เชื่อมั่นว่าวัฒนธรรมมีผลในทุกๆ อย่าง และเป็นสิ่งที่ผลให้ AI สิงคโปร์ (AI Singapore: AISG) ซึ่งเป็นโครงการของภาครัฐริเริ่มโดยมูลนิธิเพื่อการวิจัยแห่งชาติของสิงคโปร์ (National Research Foundation) เพื่อเสริมสร้างศักยภาพของประเทศในด้าน AI และทำให้ LLM มีความแม่นยำตรงกับบริบททางวัฒนธรรมของแต่ละประเทศมากยิ่งขึ้น โดยเฉพาะสำหรับประเทศในภูมิภาคเอเชียตะวันออกเฉียงใต้

***SEA-LION - โครงการแรกสำหรับภูมิภาค

ต่อยอดจากโครงสร้างพื้นฐานของ AWS ที่มีความยืดหยุ่นในการปรับขนาดได้อย่างง่ายดาย AISG ได้พัฒนา SEA-LION ซึ่งเป็นโครงการด้าน LLM ที่ถูกเทรนและรับคำสั่งเฉพาะเจาะจงสำหรับภาษาและวัฒนธรรมจากประเทศในเอเชียตะวันออกเฉียงใต้ (การเทรนล่วงหน้าและรับคำสั่งแบบ instruct-tuned เป็นวิธีการที่ช่วยให้สามารถควบคุมพฤติกรรม LLM ได้ดียิ่งขึ้น) โครงการแรกในภูมิภาค


SEA-LION ยังทำหน้าที่เป็นรากฐานสำหรับโครงการ National Multimodal LLM ของสิงคโปร์ ซึ่งมีส่วนสนับสนุนในการวิจัยและนวัตกรรมด้าน AI ของประเทศอีกด้วย โครงการนี้เป็นส่วนหนึ่งของ National AI Strategy 2.0 ซึ่งเป็นแผนการใช้เทคโนโลยี AI ในสิงคโปร์ให้ลึกซึ้งยิ่งขึ้น โมเดลนี้จะมุ่งเน้นไปที่ภาษาที่มีการใช้งานอย่างแพร่หลายในเอเชียตะวันออกเฉียงใต้ เช่น บาฮาซาอินโดนีเซีย บาฮาซามลายู ไทย และเวียดนาม และในระยะยาวจะถูกขยายไปยังภาษาอื่นๆ ในเอเชียตะวันออกเฉียงใต้เข้ามา เช่น พม่าและลาว

การสร้าง LLM ที่ครอบคลุมหลายประเทศในระดับภูมิภาคนั้นต้องใช้ข้อมูล[เชิงลึก]และเจาะจงกับท้องถิ่นในภาษาที่เกี่ยวข้องอีกด้วย ตัวอย่างของความแตกต่างทางภาษาท้องถิ่นคือคำว่า “LOL” (คำย่อของ “laughing out loud” ในภาษาอังกฤษ) ในประเทศไทยคนมักใช้ “55555” ในขณะที่ชาวอินโดนีเซียมักใช้ “wkwkwk” LLM ที่ได้รับการเทรนด้วยข้อมูลที่หลากหลายทางวัฒนธรรม เช่น SEA-LION ช่วยเพิ่มความสามารถของแอปพลิเคชัน Generative AI ให้เข้าใจแง่มุมที่ละเอียดอ่อน เหมาะแก่ประสบการณ์ใช้งานของมนุษย์ อีกทั้งยังสามารถเข้าใจความซับซ้อนทางสังคมที่อาจเป็นอุปสรรคอีกด้วย

***เร่งพัฒนา Generative AI ต้องเจาะจงท้องถิ่น

ขณะนี้ SEA-LION พร้อมใช้งานแล้วบน Amazon SageMaker JumpStart รวมทั้งโมเดลที่ได้รับการเทรนล่วงหน้า (pre-trained models) และเปิดให้ใช้งานแบบสาธารณะ เพื่อช่วยลูกค้าทั่วโลกในการเริ่มต้นใช้งานกับแมชชีนเลิร์นนิง (ML) โมเดล SEA-LION ที่ได้เปิดตัวไปแล้วมีขนาดที่ค่อนข้างเล็กด้วยพารามิเตอร์ขนาด 3 พันล้าน และ 7 พันล้าน และได้รับการเทรนโดยใช้ Amazon EC2 ซึ่งเป็นบริการที่ให้ความสามารถในการประมวลผลที่ปรับขนาดได้บนคลาวด์ โมเดลรุ่นเล็กๆ เหล่านี้มีความยืดหยุ่นและเข้าถึงได้ง่ายกว่า LLM ที่ใช้กันทั่วไปในตลาดปัจจุบัน ซึ่งโดยปกติแล้วจะมีขนาดหลายแสนล้านพารามิเตอร์

ในช่วงปลายเดือนมกราคม พ.ศ.2567 AISG ได้ทำการเปิดตัวโมเดล SEA-LION เชิงพาณิชย์ ด้วยพารามิเตอร์เพื่อรองรับการปรับแต่งคำสั่งและจะมีความสามารถมากขึ้นในการจับความแตกต่างทางภาษาในเอเชียตะวันออกเฉียงใต้ รวมไปถึงปรับปรุงความเข้าใจในบริบทต่างๆ พัฒนาการใช้เหตุผลในหลายภาษา และสร้างผลลัพธ์ที่มีบริบทมากยิ่งขึ้น

พอล คอนดิลิส ผู้ช่วยรองประธาน (AVP) ด้าน Data Science ที่ Tokopedia กล่าวว่าการที่ AISG ให้ความสำคัญกับภาษาท้องถิ่นในเอเชียตะวันออกเฉียงใต้ที่ไม่ค่อยมีบทบาทนั้นมีความสำคัญอย่างมาก เนื่องจากลูกค้าส่วนใหญ่ของ Tokopedia โต้ตอบกับ AISG ในภาษาบาฮาซา อินโดนีเซีย

"การพัฒนาโมเดลที่มีความคล่องแคล่วในภาษาท้องถิ่นนั้นจะช่วยเพิ่มประสิทธิภาพของเราในการสื่อสารกับลูกค้าและพัฒนาประสบการณ์ของพวกเขา เรากำลังอยู่ในระยะทดลองขั้นต้นกับ SEA-LION ซึ่งโดยรวมดูมีแนวโน้มที่ดี”

หยิง เฉาเหว่ย หัวหน้านักวิทยาศาสตร์ที่ NCS กล่าวเสริมว่า ในขณะที่เทคโนโลยีกำลังพัฒนาไปอย่างรวดเร็วในเอเชียแปซิฟิก NCS จึงมองเห็นโอกาสที่น่าตื่นเต้นในการปรับแต่งโมเดลภาษาเพื่อสะท้อนถึงความหลากหลายทางภาษาในภูมิภาค และพลิกโฉมวิธีการประมวลผลและแบ่งปันข้อมูล บริษัทยินดีที่ได้ทำงานอย่างใกล้ชิดกับ AISG ในโครงการ SEA-LION LLM ที่ใช้ประโยชน์จากทรัพยากรของ AWS

"โครงการนี้ช่วยลดความเหลื่อมล้ำทางดิจิทัลโดยการปรับปรุงการสื่อสารระหว่างวัฒนธรรม และมอบประสบการณ์ที่เจาะจงให้สำหรับแต่ละท้องถิ่น นอกจากนี้ ธุรกิจและภาครัฐยังสามารถใช้ประโยชน์จากความเชี่ยวชาญของ NCS ในการตอบสนองความต้องการทางธุรกิจผ่านการใช้แอปพลิเคชันที่ขับเคลื่อนด้วย LLM เพื่อควบคุมศักยภาพสูงสุดของ LLM ในโครงการ SEA-LION อีกด้วย"

***ML และการประมวลผล

การสร้าง การเทรน และการใช้งาน LLM ต้องใช้เวลา ทรัพยากรการประมวลผลจำนวนมาก และความเชี่ยวชาญ AISG จึงได้ร่วมมือกับ AWS เพื่อจัดการกับความท้าทายเหล่านี้ โดยการใช้ประสิทธิภาพอันทรงพลังของคลาวด์สำหรับงานต่างๆ เช่น การเทรน ML และการประมวลผลประสิทธิภาพสูงโดยใช้ NVIDIA A100 Tensor Core GPU ซึ่งมอบผลลัพธ์ระดับสูงสุดพร้อมเครือข่ายที่รวดเร็วและตอบสนองไว

ขนาดที่กะทัดรัดของ SEA-LION ทำให้มีความคุ้มค่าและประสิทธิภาพมากกว่า LLM ขนาดใหญ่ที่มีพารามิเตอร์มากกว่าหลายร้อยเท่า LLM ขนาดเล็กช่วยให้นักพัฒนาสามารถใช้งานได้เร็วขึ้น ปรับแต่งได้ในราคาที่ถูกกว่า และดำเนินการได้รวดเร็วยิ่งขึ้นในระหว่างการเทรน ความง่ายในการปรับใช้ LLM ขนาดเล็กบนอุปกรณ์เคลื่อนที่หรือที่ Edge ยังช่วยให้ธุรกิจต่างๆ สามารถนำมาใช้และสร้างแอปพลิเคชันได้ง่ายขึ้นอีกด้วย

"LLM ที่มีความเฉพาะด้านภาษาและวัฒนธรรม เช่น SEA-LION ของ AISG จะช่วยให้การสื่อสารและความเข้าใจระหว่างวัฒนธรรมราบรื่นยิ่งขึ้น ช่วยรักษารายละเอียดทางวัฒนธรรม และช่วยให้ภาครัฐและธุรกิจสามารถให้บริการประชาชนและลูกค้าในเอเชียตะวันออกเฉียงใต้ได้ดีขึ้น เรารู้สึกตื่นเต้นที่ได้ช่วย AISG ปลดล็อกศักยภาพของ Generative AI เพื่อสร้างประโยชน์มากมายให้เศรษฐกิจต่างๆ ในอาเซียน เราหวังว่าจะได้ช่วยให้ AISG ขยายการเข้าถึงของ LLM ด้วยเครือข่ายลูกค้าและพาร์ตเนอร์ของเราในภูมิภาค” เอลซี่ ตัน ผู้จัดการประจำประเทศสิงคโปร์ ฝ่ายภาครัฐทั่วโลกที่ AWS กล่าวทิ้งท้าย


กำลังโหลดความคิดเห็น