เอดับลิวเอส (Amazon Web Services) หรือ AWS และเอ็นวิเดีย (NVIDIA) ประกาศความร่วมมือเชิงกลยุทธ์เพื่อนำเสนอโครงสร้างพื้นฐานซูเปอร์คอมพิวเตอร์ ซอฟต์แวร์ และบริการใหม่สำหรับ Generative AI ลุยขับเคลื่อนเวิร์กโหลดระดับเทราไบต์
อดัม เซลิปสกี้ (Adam Selipsky) ซีอีโอ AWS กล่าวว่า AWS และ NVIDIA มีความร่วมมือกันมากว่า 13 ปีแล้ว โดยเริ่มจากอินสแตนซ์คลาวด์ GPU ตัวแรกของโลก วันนี้ ทั้งคู่ได้นำเสนอโซลูชัน NVIDIA GPU ที่หลากหลายสำหรับเวิร์กโหลดทั้งกราฟิก เกม การประมวลผลประสิทธิภาพสูง การเรียนรู้ของเครื่อง และ Generative AI ในปัจจุบัน
"เรายังคงสร้างสรรค์นวัตกรรมร่วมกับ NVIDIA ต่อไปเพื่อทำให้ AWS เป็นสถานที่ที่ดีที่สุดในการรัน GPU โดยผสมผสาน NVIDIA Grace Hopper Superchips รุ่นถัดไปเข้ากับเครือข่ายที่ทรงพลัง EFA ของ AWS การทำคลัสเตอร์แบบไฮเปอร์สเกลของ EC2 UltraClusters และความสามารถด้านการจำลองเสมือนขั้นสูงของ Nitro”
AWS นั้นเป็นบริษัทในเครือ Amazon.com การประกาศการขยายความร่วมมือเชิงกลยุทธ์กับ NVIDIA ครั้งนี้เกิดขึ้นเพื่อมอบระบบโครงสร้างพื้นฐาน ซอฟต์แวร์ และบริการในการขับเคลื่อนนวัตกรรมปัญญาประดิษฐ์ (AI) โดยการผสมผสานเทคโนโลยี NVIDIA และ AWS ซึ่งได้นำระบบมัลติโหนดใหม่ล่าสุดของ NVIDIA ที่มี GPU, CPU และซอฟต์แวร์ AI รวมถึงระบบการจำลองเสมือนและการรักษาความปลอดภัยขั้นสูงของ AWS Nitro System การเชื่อมต่อระหว่าง Elastic Fabric Adapter (EFA) และ Ultra Cluster ความสามารถในการปรับขนาด เพื่อการเทรนนิ่งพื้นฐานและการสร้างแอปพลิเคชัน Generative AI เพื่อตอบโจทย์การเพิ่มประสิทธิภาพและการประมวลผลของทุกอุตสาหกรรม
ภายใต้ความร่วมมือนี้ AWS จะเป็นผู้ให้บริการระบบคลาวด์รายแรกที่นำ NVIDIA GH200 Grace Hopper Superchips พร้อมเทคโนโลยี NVLink แบบหลายโหนดใหม่มาสู่ระบบคลาวด์ แพลตฟอร์มหลายโหนด NVIDIA GH200 NVL32 เชื่อมต่อ 32 Grace Hopper Superchips พร้อมเทคโนโลยี NVIDIA NVLink และ NVSwitch ไว้ในอินสแตนซ์เดียว แพลตฟอร์มดังกล่าวจะพร้อมใช้งานบนอินสแตนซ์ Amazon Elastic Compute Cloud (Amazon EC2) ที่เชื่อมต่อกับเครือข่ายทรงพลัง (EFA) ของ Amazon ซึ่งสนับสนุนโดยการจำลองเสมือนขั้นสูง (AWS Nitro System) และการทำคลัสเตอร์แบบไฮเปอร์สเกล (Amazon EC2 UltraClusters) ช่วยให้สามารถปรับขนาดได้ไปจนถึง GH200 Superchips นับพันตัว
นอกจากนี้ NVIDIA และ AWS จะร่วมมือกันในการโฮสต์ NVIDIA DGX Cloud - NVIDIA AI-training-as-a-service หรือบริการฝึกอบรม AI ของ NVIDIA บน AWS จะเป็นการใช้ DGX Cloud ตัวแรกที่มี GH200 NVL32 ช่วยให้นักพัฒนามีหน่วยความจำที่ใช้ร่วมกันที่ใหญ่ที่สุดในอินสแตนซ์เดียว DGX Cloud บน AWS จะเร่งการฝึกอบรม Generative AI เชิงสร้างสรรค์ที่ล้ำสมัยและโมเดลภาษาขนาดใหญ่ที่สามารถเข้าถึงได้มากกว่า 1 ล้านล้านพารามิเตอร์
ในอีกด้าน NVIDIA และ AWS ร่วมมือกันใน Project Ceiba เพื่อสร้างซูเปอร์คอมพิวเตอร์ AI ที่ขับเคลื่อนด้วย GPU ที่เร็วที่สุดในโลก ซึ่งเป็นระบบขนาดใหญ่ที่มี GH200 NVL32 และการเชื่อมต่อระหว่างกันของ Amazon EFA ที่โฮสต์โดย AWS สำหรับทีมวิจัยและพัฒนาของ NVIDIA ซูเปอร์คอมพิวเตอร์เครื่องแรกที่มี NVIDIA GH200 Superchips จำนวน 16,384 ตัว และสามารถประมวลผล AI ได้ 65 exaflops จะถูกใช้งานโดย NVIDIA เพื่อขับเคลื่อนนวัตกรรม AI ใหม่เชิงสร้างสรรค์
ทั้งนี้ AWS จะแนะนำอินสแตนซ์ Amazon EC2 ใหม่เพิ่มเติมสามอินสแตนซ์ : อินสแตนซ์ P5e ที่ขับเคลื่อนโดย NVIDIA H200 Tensor Core GPU สำหรับระบบที่ขยายขนาดได้ รวมถึงเวิร์กโหลดของ Generative AI และ HPC ที่ล้ำสมัย และอินสแตนซ์ G6 และ G6e ที่ขับเคลื่อนโดย NVIDIA L4 GPU และ NVIDIA L40S GPU ตามลำดับ เหมาะสำหรับชุดแอปพลิเคชันที่หลากหลาย เช่น การปรับแต่ง AI การอนุมาน กราฟิก และวิดีโอ อินสแตนซ์ G6e เหมาะอย่างยิ่งสำหรับการพัฒนาเวิร์กโฟลว์ 3D Digital Twins และแอปพลิเคชันอื่นๆ ที่ใช้ NVIDIA Omniverse™ ซึ่งเป็นแพลตฟอร์มสำหรับเชื่อมต่อและสร้างแอปพลิเคชัน 3 มิติ ที่เปิดใช้งาน AI
เจนเซ่น ฮวง (Jensen Huang) ผู้ก่อตั้งและซีอีโอของ NVIDIA กล่าวว่า Generative AI มีบทบาทในการเปลี่ยนแปลงเวิร์กโหลดบนคลาวด์ และนำการประมวลผลที่เร่งความเร็วมาเป็นรากฐานของการสร้างเนื้อหาที่หลากหลาย การขับเคลื่อนโดยภารกิจร่วมกันครั้งนี้ จึงเป็นการส่งมอบ Generative AI ที่ล้ำสมัยที่คุ้มค่าให้ลูกค้าทุกคน
"NVIDIA และ AWS กำลังทำงานร่วมกันทั่วทั้งสแต็กการประมวลผลทั้งหมด ครอบคลุมโครงสร้างพื้นฐาน AI ไลบรารีการเร่งความเร็ว โมเดลพื้นฐาน ไปจนถึงบริการ Generative AI”
ที่สุดแล้ว ซอฟต์แวร์ NVIDIA บน AWS จะช่วยให้ Amazon นำนวัตกรรมใหม่มาสู่บริการและการดำเนินงาน โดยที่ผ่านมา AWS ใช้เฟรมเวิร์ก NVIDIA NeMo เพื่อฝึกอบรม Amazon Titan LLM รุ่นถัดไปบางรุ่น Amazon Robotics ได้เริ่มใช้ประโยชน์จาก NVIDIA Omniverse Isaac แล้ว เพื่อสร้างแฝดดิจิทัลสำหรับการทำงานอัตโนมัติ เพิ่มประสิทธิภาพ และวางแผนคลังสินค้าอัตโนมัติในสภาพแวดล้อมเสมือนจริง ก่อนที่จะปรับใช้จริงต่อไป