เอสซีบี เท็นเอ็กซ์ (SCB 10X) สานต่อภารกิจพัฒนาโมเดลภาษาขนาดใหญ่ (LLM) สัญชาติไทย “ไต้ฝุ่น” (Typhoon) ล่าสุดสร้างประวัติศาสตร์ เป็นตัวแทนหนึ่งเดียวจากประเทศไทยและอาเซียนที่ผ่านเข้ารอบสุดท้ายในโครงการระดับโลก AWS Gen AI Accelerator หรือ GAIA ชูจุดเด่นด้านประสิทธิภาพสูง ต้นทุนต่ำ และความแม่นยำภาษาไทยที่เหนือกว่าโมเดลต่างชาติ เตรียมขยายขีดความสามารถสู่ตลาดเชิงพาณิชย์เต็มตัวบนโครงสร้างพื้นฐานของ AWS
นายกสิมะ ธารพิพิธชัย หัวหน้าฝ่ายกลยุทธ์ปัญญาประดิษฐ์ (Head of AI Strategy) บริษัท เอสซีบี เท็นเอกซ์ จำกัด กล่าวหลัง Typhoon ได้รับการอัดฉีดจากโครงการ AWS GAIA 2025 ว่าแผนทำตลาดของไต้ฝุ่นในปี 2026 คือการขยายการเข้าถึง โดยการนำโมเดลขึ้นสู่โครงสร้างพื้นฐานของ AWS จะทำให้สามารถใช้งานในระดับ Production Grade, ปรับขนาดได้, และลดความหน่วง ซึ่งเป็นสิ่งสำคัญมากสำหรับบริการด้านเสียงภาษาไทย
"กลยุทธ์หลักคือการขยายการเข้าถึงและจัดหา Production-Grade Inference ให้กับผู้ใช้ผ่านการสนับสนุนของ AWS และเครือข่ายพันธมิตร เนื่องจากที่ผ่านมาทีมงานเพิ่งเริ่มฟอร์มตัวและยังไม่พร้อมที่จะตอบสนองความต้องการด้าน Production Grade หรือ Service Level Agreement (SLA) ด้วยตัวเอง การใช้ AWS Infrastructure โดยเฉพาะใน Region ที่อยู่ใกล้ผู้ใช้งาน (เช่น Bangkok Region) จะช่วยลดความหน่วงได้อย่างมาก ซึ่งเป็นสิ่งสำคัญสำหรับ Use Case ที่เกี่ยวข้องกับเสียง เช่น Voice Agent"
***หนึ่งเดียวของอาเซียน
ตัวแทนรายเดียวจากประเทศไทยและหนึ่งเดียวของอาเซียนที่ได้รับคัดเลือกให้เข้าร่วมโครงการบ่มเพาะสตาร์ทอัปของ AWS อย่าง SCB 10X นั้นได้พัฒนาโมเดลหลากหลายประเภทภายใต้ร่ม Typhoon ได้แก่ Text Models (เช่น Typhoon 1.0, 1.5, 2.0, 2.5), Small Language Models (SLMs), Speech-to-Text (ASR) และ Text-to-Speech, รวมถึง Multimodal Models และ OCR โมเดล ASR สำหรับภาษาอีสาน ซึ่งกำลังจะเปิดตัวในเร็ว ๆ นี้
หนึ่งในความเก่งของ Typhoon คือโมเดลการรู้จำเสียงพูดอัตโนมัติ (ASR Real-Time) ที่มีประสิทธิภาพสูงและประหยัดต้นทุนอย่างมหาศาล โดยหากองค์กรผู้ใช้งานโฮสต์บนฮาร์ดแวร์ของบริษัทเอง จะมีค่าใช้จ่ายต่ำกว่าโมเดลต่างชาติประมาณ 400 เท่า สำหรับการใช้โมเดล ASR Real-Time ของไต้ฝุ่น ที่โฮสต์อยู่บน AWS เพื่อถอดเสียงรวม 500,000 นาทีนั้น มีต้นทุนโดยประมาณอยู่ที่ 12 เหรียญสหรัฐฯ เท่านั้น
"Typhoon สามารถแก้ไขช่องว่างในตลาดไทยที่โมเดลต่างชาติอาจยังทำได้ไม่ดี โดยเฉพาะอย่างยิ่งในด้าน OCR (Optical Character Recognition) สำหรับเอกสารราชการไทย ซึ่งโมเดลต่างชาติมักมีปัญหาด้านความแม่นยำในการอ่านตัวเลขและตัวอักษร"
การที่ Typhoon ซึ่งเป็นโครงการพัฒนาเทคโนโลยีภาษาโอเพนซอร์ส (Open Source) ได้รับการคัดเลือกให้เป็นหนึ่งใน 40 ทีมสุดท้ายจากทั่วโลก เข้าร่วมโครงการบ่มเพาะของ AWS นั้นถือเป็นจุดเปลี่ยนสำคัญของการพัฒนาเทคโนโลยี AI ระดับรากฐานสำหรับภาษาไทยโดยเฉพาะ เนื่องจากแม้ว่าโมเดลภาษาจากต่างชาติจะพัฒนาขึ้นมากในช่วง 2 ปีที่ผ่านมา แต่ยังคงมีข้อจำกัดด้านการสนับสนุนภาษาไทย โดยเฉพาะในประเด็นด้านความแม่นยำ เนื่องจากภาษาไทยยังคงถูกจัดเป็นภาษาที่มีทรัพยากรต่ำ (Low Resource Language) ในโลกของ AI/Machine Learning
ทีมพัฒนาเชื่อว่า Typhoon เป็นโมเดลแม่นยำสูงสำหรับการใช้งานในโลกธุรกิจจริง โดยเฉพาะการประมวลผลเอกสารราชการไทย ขณะเดียวกันก็คุ้มค่าด้านราคาเพราะโมเดลภาษา เช่น Typhoon 2.1 มีราคาเชิงพาณิชย์อยู่ที่ประมาณ 0.2 เหรียญสหรัฐฯ ต่อ 1 ล้านโทเคน
***ผนึกกำลัง AWS เร่งสปีดใช้งานจริง
นายวัตสัน ถิรภัทรพงศ์ ผู้จัดการประจำประเทศ (Country Manager) ของ AWS ประเทศไทย กล่าวถึงการสนับสนุนโครงการ Typhoon ของ AWS ว่า Typhoon มีโอกาสได้รับเครดิตสำหรับการใช้งานสูงสุดถึง 1 ล้านเหรียญสหรัฐฯ โดยบทบาทของ AWS คือการสนับสนุนโครงสร้างพื้นฐานที่เชื่อถือได้ ปลอดภัย และสามารถปรับขยายได้ (Scalability) เพื่อให้ Typhoon พร้อมเข้าสู่ตลาดเชิงพาณิชย์ เพิ่มทางเลือกให้องค์กรธุรกิจผู้ใช้ AWS ได้หลากหลายมากขึ้น
"AWS เชื่อมั่นในแนวทางหลายโมเดล โดยไม่เชื่อว่าจะมีโมเดลใดโมเดลหนึ่งครองโลก ดังนั้น AWS จึงใช้บริการอย่าง Bedrock เพื่อให้ลูกค้าสามารถเข้าถึงโมเดลที่หลากหลายและเฉพาะเจาะจงมากขึ้น AWS พร้อมสนับสนุนให้ผู้พัฒนา LLM ในไทยสามารถเข้าถึง Bedrock และ Marketplace เพื่อเผยแพร่โซลูชันให้กว้างขวางยิ่งขึ้น"
ปัจจุบัน โมเดล Typhoon มีการนำไปใช้งานหลากยูสเคสในหลายภาคส่วน ทั้งภาคการเงินที่มีการทดลองใช้ในองค์กรย่อยของ SCBX เอง เช่น ระบบแชทบอทตอบคำถามภายในองค์กร และการใช้ OCR ยังมีภาคการแพทย์ ที่ร่วมมือกับ Si Data Plus ของโรงพยาบาลศิริราช ใช้โมเดล Typhoon เพื่อสร้างแชทบอทตอบคำถามบุคลากร โดยเน้นการควบคุมข้อมูลส่วนบุคคล (Privacy) และการผูกกับฐานข้อมูลโรงพยาบาล
รวมถึงภาคยานยนต์ โดย Toyota Leasing Thailand ได้ใช้ OCR ของ Typhoon เพื่อแปลงเอกสารสัญญาจำนวนมากให้เป็นดิจิทัล (Digitize) ขณะที่ภาคการศึกษา Typhoon ได้ร่วมกับสภาการศึกษาพัฒนา Exam Preparation Chatbot เพื่อช่วยนักเรียนเตรียมตัวสอบ PISA ซึ่งมักเป็นข่าวว่าคะแนนเด็กไทยลดลงต่อเนื่องหลายปี โดยแชทบอทสามารถให้ฟีดแบ็กและอธิบายผลสอบได้
สุดท้ายคือภาคการวิจัย โดย Typhoon และ TDRI หรือสถาบันวิจัยเพื่อการพัฒนาประเทศไทย ได้ใช้ API ของ Typhoon ในการวิเคราะห์ตลาดแรงงานไทย โดยการจัดกลุ่มประเภทงานจาก Job Description ที่โพสต์บนอินเทอร์เน็ต ทำให้งานวิเคราะห์รวดเร็วขึ้น
สำหรับอนาคตของ Typhoon ผู้พัฒนายืนยันว่าจะยังคงมุ่งเน้นการพัฒนาโมเดลหลักหรือ Core Model Offerings ทั้งแบบข้อความ เสียง และภาพ โดยเน้นปรับปรุงประสิทธิภาพ ความแม่นยำ และความหน่วงให้ดียิ่งขึ้นอย่างต่อเนื่อง ขณะที่ยังคงรักษาต้นทุนให้ต่ำ
ปัจจุบัน จำนวนผู้พัฒนา LLM ภาษาไทยในไทยนั้นลดลงเหลือ 3 เจ้าหลัก ได้แก่ Typhoon, OpenThaiGPT และโมเดลจากภาครัฐ ซึ่งแม้จะน้อยกว่าประเทศใหญ่อย่างจีนหรือญี่ปุ่น แต่ Typhoon ก็ได้รับคำชื่นชมจากหลายประเทศในอาเซียนด้านผลงานวิจัยและประสิทธิภาพ และมีแผนจะร่วมมือกับแล็บต่างชาติ เช่น โครงการ AI ของสิงคโปร์ เพื่อช่วยเสริมขีดความสามารถภาษาไทยในโมเดลระดับโลกต่อไป.