8 ไฮไลต์เครื่องมือ AI ใหม่จาก Google IO 2024

กูเกิล (Google) ออกมาอัปเดตความสามารถของ Generative AI ครั้งใหญ่ในปีนี้ ภายในงานประชุมนักพัฒนา Google I/O 2024 ที่มีการนำเสนอชุดเครื่องมือ AI ที่น่าสนใจทั้งการเป็นผู้ช่วย AI ที่โต้ตอบด้วยเสียง ไปจนถึงสร้างวิดีโอความละเอียดสูงเพื่อนำไปใช้งานใน Google Veo

ซุนดาร์ พิชัย ซีอีโอ กูเกิล กล่าวว่า กูเกิลได้ลงทุนใน AI มานานกว่า 10 ปี และได้สร้างสรรค์นวัตกรรมในทุกด้านทั้งงานวิจัย ผลิตภัณฑ์ และโครงสร้างพื้นฐานต่างๆ และทุกวันนี้เรายังคงอยู่ในช่วงเริ่มต้นของการเปลี่ยนแปลงไปสู่ยุค AI

“เรายังมองเห็นโอกาสสำหรับครีเอเตอร์ นักพัฒนาซอฟต์แวร์ สตาร์ทอัป และทุกๆ คนที่ต้องการใช้ Generative AI อย่าง Gemini มาสร้างโอกาส ซึ่งที่ผ่านมามีนักพัฒนาซอฟต์แวร์กว่า 1.5 ล้านคนใช้โมเดล Gemini ในเครื่องมือต่างๆ”

ขณะเดียวกัน Google ยังได้นำ Gemini เข้าไปช่วยเพิ่มประสิทธิภาพของผลิตภัณฑ์ทั้งใน Google Search Google Photos Google Workspace และ Android จนทำให้มีผู้ใช้งานรวมกันแล้วกว่า 2 พันล้านคน

โดยภายในงาน Google I/O 2024 กูเกิล ได้ประกาศความคืบหน้าครั้งใหญ่ในการนำ Gemini และบรรดาโมเดลภาษาต่างๆ ไปใช้งานร่วมกับบริการหลักของ Google เพื่อช่วยตอบสนองความต้องการของผู้บริโภค ไม่ว่าจะเป็น

1.Google Veo และ Imagen 3 เครื่องมือช่วยสร้างภาพ และวิดีโอความละเอียดสูงระดับ 1080p จากการป้อนคำสั่งเข้าไปที่จะช่วยเปิดโลกของครีเอเตอร์ให้มีความคิดสร้างสรรค์ในการส้างวิดีโอคอนเทนต์มากขึ้น

2.Project Astra ผู้ช่วย AI ที่สามารถทำความเข้าใจข้อมูลหลายรูปแบบ และสนทนากับผู้ใช้ได้แบบเรียลไทม์ คล้ายๆ กับผู้ช่วยส่วนตัว Jarvis ในภาพยนต์ Ironman ซึ่งกำลังอยู่ระหว่างการพัฒนา และคาดว่าจะเริ่มเห็นนำไปใช้งานในช่วงปลายปีนี้

3.อัปเดต Gemini 1.5 Pro ช่วยให้ผู้ใช้งาน Generative AI สามารถป้อนข้อมูลเข้าไปเพื่อให้ Gemini ศึกษาข้อมูลได้มากกว่าเดิม ไม่ว่าจะเป็นการทำความเข้าใจข้อความ รูปภาพ ไฟล์เอกสารต่างๆ และช่วยให้สรุปข้อมูลออกมาได้แม่นยำมากขึ้น

4.Gemini 1.5 Flash โมเดลภาษาขนาดเล็กที่สามารถรองรับข้อมูลจำนวนมาก เหมาะกับการนำไปประมวลผลข้อมูลที่ต้องการความเร็วในการใช้งาน ที่จะเริ่มเปิดให้ใช้งานใน AI Studio และ Vertex AI สำหรับนักพัฒนาเพื่อนำไปใช้งานต่อไป

5.AI Overview ใน Google Search ทำให้การค้นหาข้อมูลบนเสิร์ชทำได้ง่ายขึ้น เพียงถามคำถามเข้าไปในช่องกรอกข้อมูล Gemini จะช่วยสร้างประสบการณ์ค้นหาข้อมูลรูปแบบใหม่ออกมาตอบคำถามได้อย่างรวดเร็ว โดยจะเริ่มให้บริการในสหรัฐฯ ก่อนขยายไปยังประเทศอื่นๆ เร็วๆ นี้

6.Ask Photos ขยายความสามารถของ Google Photos ให้รองรับการค้นหาข้อมูลได้หลากหลายมากขึ้น เช่น การค้นหาทะเบียนรถจากคลังข้อมูลรูปแบบ หรือแม้แต่ให้รวบรวมเหตุการณ์ในความทรงจำออกมาเป็นอัลบั้มภาพ

7.Workspace รองรับ Gemini 1.5 Pro อีกความน่าสนใจคือการใช้งานเครื่องมือของ Workspace ที่ผู้ใช้สามารถสั่งให้ Gemini ระบุอีเมลที่เกี่ยวข้อง วิเคราะห์ไฟล์แนบ เพื่อสรุปประเด็นสำคัญ ไปจนถึงขอให้ Gemini สรุปการประชุมจากวิดีโอที่บันทึกใน Google Meet

8.Gemini บน Android ที่ฉลาดขึ้น ด้วยการนำ Gemini Nano เข้าไปช่วยให้เข้าใจภาพ เสียง และข้อความ ทำให้ผู้ใช้งานแอนดรอยด์สามารถใช้การวงกลมเพื่อค้นหา (Circle to Search) ได้ครอบคลุมมากขึ้น อย่างโจทย์คณิตศาสตร์ เข้าใจกราฟ แผนภูมิต่างๆ หรือแม้แต่การป้องกันโทรศัพท์จากมิจฉาชีพ เมื่อพบว่าบทสนทนาที่เกิดขึ้นมีโอกาสหลอกลวง (รองรับภาษาอังกฤษก่อน และจะเปิดให้ใช้งานในอนาคต)