Google Cloud นับถอยหลัง Google Vids สร้างวิดีโอด้วย AI

เปิดบทสรุปงาน Next 2024 เวทีที่กูเกิลคลาวด์ (Google Cloud) ประกาศการอัปเดตเรื่องราวล่าสุดเกี่ยวกับเทคโนโลยีปัญญาประดิษฐ์ (AI) โดยหนึ่งในนั้นคือการนับถอยหลังการเปิดตัวแอปพลิเคชัน “กูเกิลวิดส์” (Google Vids) ซึ่งเป็นแอปสร้างวิดีโอที่ขับเคลื่อนด้วย AI ที่จะแจ้งเกิดในเดือนมิถุนายนนี้

***1 ปี AI สู่สาธารณะ

Google Cloud มองว่าโลกเพิ่งเริ่มจินตนาการได้ว่าเทคโนโลยี Generative AI สามารถเปลี่ยนแปลงธุรกิจได้อย่างไรในช่วง 1 ปีที่ผ่านมา และท่ามกลางการเปลี่ยนแปลงดังกล่าวที่กำลังดำเนินไปด้วยดี Google เองก็มีจุดมุ่งหมายเดียวกัน นั่นคือการทำให้ AI เป็นประโยชน์สำหรับทุกคน เพื่อปรับปรุงชีวิตของผู้คนให้มากที่สุดเท่าที่จะเป็นไปได้

Google Cloud มองว่าสิ่งที่รออยู่คือโลกของเอเยนต์ที่ขับเคลื่อนด้วย AI ที่เชื่อมต่อกับคลาวด์ ด้วยพอร์ตโฟลิโอ AI ทั้งหมดของ Google Cloud ทั้งโครงสร้างพื้นฐาน, Gemini, โมเดล และ Vertex AI ทำให้ลูกค้าและคู่ค้า Google กำลังสร้างตัวแทน AI หรือเอเยนต์ที่ซับซ้อนมากขึ้น ซึ่งจะให้บริการลูกค้า สนับสนุนพนักงาน และช่วยสร้างเนื้อหา และอื่นๆ อีกมากมาย โดย Customer Agents จะช่วยให้ธุรกิจให้บริการผ่านหลายช่องทางในเวลาเดียวกัน เช่น เว็บไซต์ มือถือ คอลเซ็นเตอร์ และจุดขายผ่านหลากหลายรูปแบบ เช่น ข้อความ เสียง และอื่นๆ

ขณะที่ Employee Agents จะช่วยให้พนักงานในองค์กรมีประสิทธิผลมากขึ้นและทำงานร่วมกันได้ดียิ่งขึ้น และ Creative Agents จะสามารถทำหน้าที่เป็นทีมออกแบบและการผลิตที่ดีที่สุด โดยทำงานเกี่ยวกับรูปภาพ สไลด์ ค้นหาแนวคิดใหม่ที่ทรงพลัง

ตามหลักคิด 3 กลุ่มเอเยนต์นี้ นวัตกรรมของผลิตภัณฑ์ที่ Google ประกาศในงาน Cloud Next 2024 เพื่อช่วยให้องค์กรทุกขนาดก้าวไปข้างหน้าในยุค AI นั้นเริ่มด้วยการปรับขนาดโครงสร้างพื้นฐาน AI ให้เหมาะสม จุดนี้ Google ย้ำว่าศักยภาพของ Gen AI ในการขับเคลื่อนการเปลี่ยนแปลงอย่างรวดเร็วนั้นขึ้นอยู่กับประสิทธิภาพของโครงสร้างพื้นฐาน โดย Google กำลังสร้างความก้าวหน้าที่สำคัญ เพื่อสนับสนุนลูกค้าในทุกชั้นของโครงสร้างข้อมูล (stack)

5 องค์ประกอบที่ Google เน้นเรื่องปรับโครงสร้าง AI ได้แก่ 1.A3 mega ผลงานการพัฒนาร่วมกับ NVIDIA โดยใช้ Tensor Core GPU H100 อินสแตนซ์ที่ใช้ GPU ใหม่นี้พร้อมใช้งานโดยทั่วไปและเพิ่มแบนด์วิดท์การเชื่อมต่อระหว่างกันเป็น 2 เท่าจากอินสแตนซ์ A3 นอกจากนี้ Google ยังเปิดตัว Confidential A3 ซึ่งช่วยให้ลูกค้ารักษาความลับและความสมบูรณ์ของข้อมูลที่ละเอียดอ่อนและเวิร์กโหลด AI ในระหว่างการฝึกอบรมและการอนุมานได้ดียิ่งขึ้น

2.NVIDIA HGX B200 และ NVIDIA GB200 NVL72: แพลตฟอร์ม NVIDIA Balckwell ใหม่ล่าสุด จะเปิดตัวบน Google Cloud ในช่วงต้นปี 2025 ใน 2 รูปแบบ ได้แก่ HGX B200 และ GB200 โดยตัว B200 ได้รับการออกแบบมาเพื่อการฝึกอบรมและการให้บริการทั่วไป ในขณะที่ GB200 NVL72 ขับเคลื่อนการอนุมานโมเดลภาษาขนาดใหญ่แบบเรียลไทม์และประสิทธิภาพการฝึกอบรมขนาดใหญ่สำหรับโมเดลขนาดล้านล้านพารามิเตอร์

3.TPU v5p ซึ่ง Google ระบุว่ากำลังประกาศความพร้อมใช้งานทั่วไปของ TPU v5p ซึ่งเป็นตัวเร่ง AI ที่ Google ออกแบบมาเพื่อการฝึกฝนและการอนุมาน โดยมีพลังการประมวลผลมากกว่าต่อพ็อดถึง 4 เท่า เมื่อเทียบกับรุ่นก่อนหน้า นอกจากนี้ Google ยังประกาศความพร้อมในการรองรับ Google Kubernetes Engine (GKE) สำหรับ TPU v5p ในปีที่ผ่านมา การใช้ GPU และ TPU บน GKE เพิ่มขึ้นมากกว่า 900%

4.ตัวเลือกพื้นที่เก็บข้อมูลที่เพิ่มประสิทธิภาพโดย AI จุดนี้ Google ย้ำว่ากำลังเร่งความเร็วในการฝึกด้วยฟีเจอร์แคชใหม่ใน Cloud Storage FUSE และ Parallelstore ซึ่งจะเก็บข้อมูลไว้ใกล้กับ TPU หรือ GPU ของลูกค้ามากขึ้น นอกจากนี้ Google ยังเปิดตัว Hyperdisk ML (ในหน้า preview) ซึ่งเป็นบริการพื้นที่เก็บข้อมูลแบบบล็อกรุ่นถัดไป ที่ช่วยเร่งเวลาโหลดโมเดลได้สูงสุดถึง 3.7 เท่า เมื่อเทียบกับตัวเลือกอื่น

และ 5.ตัวเลือกใหม่สำหรับ Dynamic Workload Scheduler ซึ่งเป็นโหมดปฏิทิน (Calendar) สำหรับการรับประกันเวลาเริ่มต้นและการเริ่มต้นแบบยืดหยุ่นเพื่อการประหยัดที่เหมาะสม จะช่วยให้ลูกค้ามั่นใจในการจัดการทรัพยากรที่มีประสิทธิภาพสำหรับการกระจายการฝึกอบรมและงานอนุมานที่ซับซ้อน

นอกจากนี้ Google ยังนำ AI เข้าใกล้จุดที่ข้อมูลถูกสร้างขึ้นและบริโภคมากขึ้น มาสู่ Edge สู่สภาพแวดล้อมใหม่ และมาสู่ Google Sovereign Clouds และ Cross-Cloud โดยยังเปิดใช้งาน AI Anywhere ผ่าน Google Distributed Cloud (GDC) ซึ่งช่วยให้สามารถเลือกสภาพแวดล้อม การกำหนดค่า และการควบคุมที่เหมาะกับความต้องการเฉพาะขององค์กรได้

*** 5 ความสามารถใหม่ใน GDC

1 ใน 5 ความสดใหม่คือการเพิ่ม NVIDIA GPU ไปยัง GDC หรือ Google Distributed Cloud โดย Google ย้ำว่ากำลังนำ NVIDIA GPUs มาสู่ GDC สำหรับการกำหนดค่าทั้งแบบเชื่อมต่อและแบบ Air-gapped แต่ละรายการจะรองรับอินสแตนซ์ที่ใช้ GPU ใหม่ เพื่อรันโมเดล AI ได้อย่างมีประสิทธิภาพ

ส่วนที่ 2 คือ GKE บน GDC เพราะเทคโนโลยี GKE แบบเดียวกับที่บริษัท AI ชั้นนำใช้บน Google Cloud จะพร้อมใช้งานใน GDC ส่วนที่ 3 คือการสนับสนุน AI โมเดล โดย Google ให้บริการโมเดล AI แบบเปิดที่หลากหลาย รวมถึง Gemma, Llama และอื่นๆ บน GDC เพื่อให้ทำงานในสภาพแวดล้อม Air-gapped และ Edge ที่เชื่อมต่อกัน ส่วนที่ 4 คือ Vector Search บน GDC ที่มีการนำพลังของ vector search มาใช้เพื่อให้สามารถค้นหาและดึงข้อมูลบน GDC สำหรับข้อมูลส่วนตัวและข้อมูลที่ละเอียดอ่อนของคุณ โดยมีเวลาแฝงที่ต่ำมาก

ส่วนที่ 5 คือ Sovereign Cloud สำหรับข้อกำหนดด้านกฎระเบียบที่เข้มงวดที่สุด จุดนี้ Google ย้ำว่าได้นำเสนอ GDC ในการกำหนดค่าแบบ Fully Air-gapped พร้อมการดำเนินงานในพื้นที่ ความอยู่รอดเต็มรูปแบบ จัดการโดย Google หรือผ่านพันธมิตรที่คุณเลือก คุณสามารถควบคุมได้อย่างสมบูรณ์ และเมื่อกฎระเบียบเปลี่ยนแปลง เราก็มีความยืดหยุ่นเพื่อช่วยให้คุณตอบสนองได้อย่างรวดเร็ว

***ลดต้นทุน ประหยัดพลังงาน

Google อธิบายว่าแม้ไม่ใช่ทุกงานจะเป็นเวิร์กโหลด AI แต่ทุกปริมาณงานที่องค์กรเรียกใช้ในระบบคลาวด์จำเป็นต้องมีการปรับให้เหมาะสม และแต่ละแอปพลิเคชันก็มีความต้องการทางเทคนิคที่แตกต่างกัน ดังนั้น Google จึงแนะนำตัวเลือกการคำนวณอเนกประสงค์ที่ช่วยให้ลูกค้าเพิ่มประสิทธิภาพสูงสุด ช่วยให้สามารถทำงานร่วมกันระหว่างแอปพลิเคชัน และบรรลุเป้าหมายด้านความยั่งยืน ทั้งหมดนี้ในขณะเดียวกันก็ลดต้นทุนอีกด้วย

Google ยกตัวอย่าง Google Axion: Arm-based CPU ตัวแรกของ Google ที่ออกแบบมาสำหรับศูนย์ข้อมูล มอบประสิทธิภาพที่ดีขึ้นสูงสุด 50% และประสิทธิภาพการใช้พลังงานที่ดีขึ้นสูงสุด 60% เมื่อเทียบกับอินสแตนซ์ที่ใช้ x86 รุ่นปัจจุบันที่เทียบเคียงได้

นอกจากนี้ Google ยังประกาศเปิดตัว N4 และ C4 ซึ่งเป็นแมชชีนซีรีส์ใหม่ในกลุ่มผลิตภัณฑ์ พอร์ตโฟลิโอ General VM Purpose ของเรา Native Bare-metal Machine Shapes ใน C3 Machine Family ความพร้อมใช้งานทั่วไปของ Hyperdisk Advanced Storage Pools และอื่นๆ อีกมากมาย

***ยังไม่มีไทย

ในอีกด้าน Google ยังได้ขยายถิ่นที่อยู่ของข้อมูลสำหรับข้อมูลที่จัดเก็บไว้สำหรับ Generative AI บนบริการ Vertex AI ไปยัง 11 ประเทศใหม่ ได้แก่ ออสเตรเลีย บราซิล ฟินแลนด์ ฮ่องกง อินเดีย อิสราเอล อิตาลี โปแลนด์ สเปน สวิตเซอร์แลนด์ และไต้หวัน

Google ระบุว่า ลูกค้าสามารถจำกัดแมชชีนเลิร์นนิงไว้เฉพาะในสหรัฐอเมริกาหรือสหภาพยุโรปได้ เมื่อใช้ Gemini 1.0 Pro และ Imagen นอกจากนี้ ภูมิภาคใหม่เหล่านี้ได้ร่วมกับอีก 10 ประเทศที่ Google ประกาศเมื่อปีที่แล้ว ช่วยให้ลูกค้าสามารถควบคุมสถานที่จัดเก็บข้อมูลของตนและวิธีการเข้าถึงข้อมูลได้มากขึ้น ทำให้ลูกค้าปฏิบัติตามข้อกำหนดด้านกฎระเบียบและความปลอดภัยทั่วโลกได้ง่ายขึ้น

***สร้างเอเยนต์ด้วย Vertex AI

ปัจจุบัน Google Cloud นำเสนอโมเดลจากนานาบริษัทมากกว่า 130 โมเดลบน Vertex AI และกำลังขยายการเข้าถึงโมเดลต่างๆ เพื่อให้ลูกค้ามีทางเลือกมากที่สุดในการเลือกโมเดล โดยหากเป็น Gemini 1.5 Pro จะมีหน้าต่างบริบทสองขนาด - โทเคน 128K และโทเคน 1 ล้าน โดยขณะนี้เปิดให้ใช้งานในรูปแบบตัวอย่างสำหรับสาธารณะแล้ว ทำให้ลูกค้าสามารถประมวลผลข้อมูลจำนวนมหาศาลได้ในสตรีมเดียว รวมถึงวิดีโอ 1 ชั่วโมง เสียง 11 ชั่วโมง โค้ดเบสที่มีโค้ดมากกว่า 30,000 บรรทัด หรือมากกว่า 700,000 คำ

ยังมี Claude 3, CodeGemma รวมถึง Imagen 2 ซึ่งเป็นเทคโนโลยีการแปลงข้อความเป็นรูปภาพขั้นสูงสุดของ Google มีคุณลักษณะการสร้างรูปภาพที่หลากหลาย เพื่อช่วยให้ธุรกิจต่างๆ สร้างภาพที่ตรงกับข้อกำหนดเฉพาะของแบรนด์ ความสามารถใหม่ในการแสดงข้อความเป็นภาพสดช่วยให้ทีมการตลาดและทีมสร้างสรรค์สามารถสร้างภาพเคลื่อนไหว เช่น GIF ซึ่งติดตั้งตัวกรองความปลอดภัยและลายน้ำดิจิทัล นอกจากนี้ เรายังประกาศความพร้อมใช้งานทั่วไปของฟีเจอร์การแก้ไขภาพขั้นสูง รวมถึงการลงสีและลงสีภายนอก และอื่นๆ อีกมากมาย

ขณะเดียวกัน Google ยังประกาศว่าขณะนี้ลายน้ำดิจิทัลพร้อมใช้งานแล้วสำหรับรูปภาพที่สร้างโดย AI ที่ผลิตโดย Imagen 2 ถือเป็นลายน้ำดิจิทัลที่ขับเคลื่อนโดย SynthID ของ Google DeepMind

***สร้างเอเยนต์ Gen AI ด้วย Google Search และข้อมูลองค์กร

ในงานนี้ Google ยังประกาศว่า Vertex AI Agent Builder สามารถรวบรวมโมเดลพื้นฐาน ตัว Google Search และเครื่องมือสำหรับนักพัฒนาอื่นเข้าด้วยกัน เพื่อให้สามารถสร้างและปรับใช้ตัวแทนได้ง่าย ถือเป็นการมอบความสะดวกสบายของคอนโซลตัวสร้างเอเยนต์แบบไม่ต้องเขียนโค้ด ควบคู่ไปกับความสามารถในการกราวดิ้งการเรียบเรียง และการเพิ่มที่มีประสิทธิภาพ

นอกจาก Vertex AI Agent Builder จะสามารถสร้างเอเยนต์ Gen AI โดยอาศัย Google Search และข้อมูลองค์กร Google ยังปรับปรุง Gemini Code Assist ซึ่งเป็นโซลูชัน AI Code Assistance สำหรับองค์กร โดย Google ปรับให้ Gemini 1.5 Pro ใน Gemini Code Assist อัปเกรดเป็นมอบ 1 ล้าน token context window ขณะเดียวกัน Google ยังการันตีว่า Gemini Code Assist จะให้คำแนะนำโค้ดที่แม่นยำยิ่งขึ้น ข้อมูลเชิงลึกที่ลึกซึ้งยิ่งขึ้น และขั้นตอนการทำงานที่คล่องตัวยิ่งขึ้น

สำหรับ Gemini Cloud Assist นั้น Google ย้ำว่าจะมอบความช่วยเหลือ AI ตลอดวงจรการใช้งานแอปพลิเคชัน ทำให้ง่ายต่อการออกแบบ รักษาความปลอดภัย ดำเนินการ แก้ไขปัญหา และเพิ่มประสิทธิภาพและต้นทุนของแอปพลิเคชัน ซึ่งจากการใช้ Gemini Code Assist กับกลุ่มนักพัฒนาของ Google พบว่าทำงานเสร็จเร็วขึ้น 40% สำหรับงานพัฒนาทั่วไป และการใช้เวลาเขียนโค้ดใหม่น้อยลง 55%

ในส่วน Google Cloud เครื่องมืออย่าง Gemini ใน BigQuery จะช่วยให้ทีมข้อมูลขององค์กรเตรียมข้อมูล ค้นพบ วิเคราะห์ และกำกับดูแล ขณะที่ Gemini ในฐานข้อมูล ถูกออกแบบให้ย้ายข้อมูลได้อย่างปลอดภัยจากระบบเดิม และ Gemini ใน Looker นั้นกำลังเปิดตัวความสามารถใหม่ที่กำลังแสดงตัวอย่าง ซึ่งช่วยให้เอเยนต์ผสานรวมกับเวิร์กโฟลว์ได้อย่างง่ายดาย

นอกจากนี้ Google ยังได้เพิ่มความสามารถ Gen AI ใหม่เพื่อให้สามารถแชตกับข้อมูลธุรกิจของคุณได้ และได้ผสานรวมกับ Google Workspace

ในอีกด้าน Gemini ยังยกระดับความปลอดภัยทางไซเบอร์ สามารถเป็น Security Agent ที่ช่วยเหลือด้านการรักษาความปลอดภัย ทำให้ Google เป็นส่วนหนึ่งของทีมการรักษาความปลอดภัย ทั้ง Gemini ในระบบกรองภัยคุกคาม และ Gemini ในการปฏิบัติการด้านความปลอดภัย ขณะเดียวกัน Google Workspace ยังเพิ่มประสิทธิภาพด้วย Gemini กลายเป็น Gemini for Workspace ที่ช่วยให้ธุรกิจมีเอเยนต์ที่ขับเคลื่อนด้วย AI ซึ่งติดตั้งอยู่ใน Gmail, Docs, Sheets และอื่นๆ

***มาแน่ Google Vids

หนึ่งในคลื่นลูกใหม่ของนวัตกรรมและการเพิ่มประสิทธิภาพของ Gemini for Google Workspace คือ Google Vids แอปใหม่สำหรับการสร้างวิดีโอที่ขับเคลื่อนด้วย AI ถือเป็นผู้ช่วยด้านการเขียนวิดีโอ การผลิต และการตัดต่อวิดีโอขององค์กรทั้งหมดได้ในที่เดียว

"Vids สามารถสร้างสตอรี่บอร์ดที่คุณแก้ไขได้อย่างง่ายดาย และหลังจากเลือกสไตล์แล้ว เครื่องมือนี้จะรวมร่างงานแรกของคุณเข้ากับฉากที่แนะนำจากวิดีโอสต๊อก รูปภาพ และเพลงประกอบ นอกจากนี้ ยังช่วยให้คุณส่งข้อความด้วยเสียงพากย์ที่ถูกต้อง ไม่ว่าจะเลือกเสียงพากย์ที่ตั้งไว้ล่วงหน้าหรือใช้เสียงของคุณเอง Vids จะทำงานร่วมกับแอป Workspace อื่นๆ ของเรา เช่น Docs, Sheets และSlide ในรูปแบบอินเทอร์เฟซที่ใช้งานง่าย และมีความสามารถในการทำงานร่วมกันและแบ่งปันโครงการได้อย่างปลอดภัยจากเบราว์เซอร์ของคุณ โดย Vids กำลังจะเปิดตัวใน Workspace Labs ในเดือนมิถุนายนนี้"

ยังมีส่วนเสริมการประชุมด้วยระบบ AI และการรับส่งข้อความ รวมถึงส่วนเสริมการรักษาความปลอดภัยด้วย AI โดยส่วนเสริมการรักษาความปลอดภัยด้วย AI มีให้บริการในราคา 10 ดอลลาร์สหรัฐต่อหนึ่งผู้ใช้ต่อเดือน และสามารถเพิ่มลงในแผน Workspace ส่วนใหญ่ได้