xs
xsm
sm
md
lg

อ้าวยังไง! ผลทดสอบชี้แชตบอต DeepSeek เสนอข้อมูลถูกต้องแค่ 17% สู้เอไอตะวันตกไม่ได้

เผยแพร่:   ปรับปรุง:   โดย: ผู้จัดการออนไลน์



ผลการทดสอบโดย NewsGuard เผยโมเดลเอไอของสตาร์ทอัปจีน DeepSeek ให้คำตอบเกี่ยวกับข่าวสารและข้อมูลต่างๆ ถูกต้องเพียง 17% และถูกจัดอยู่ในอันดับที่ 10 จากทั้งหมด 11 หรือ “รองบ๊วย” ในแง่ของความถูกต้องแม่นยำ เมื่อเปรียบเทียบกับโมเดลเอไอตะวันตกอย่าง ChatGPT ของค่าย OpenAI และ Gemini ของ Google

NewsGuard ซึ่งเป็นระบบการให้คะแนนสำหรับเว็บไซต์ข่าวและข้อมูลได้เผยแพร่รายงานเมื่อวันพุธ (29 ม.ค.) โดยระบุว่า แชตบอตของ DeepSeek มีการผลิตซ้ำข้อมูลเท็จถึง 30% และให้คำตอบแบบกว้างๆ หรือไม่เป็นประโยชน์ 53% ของเวลาทั้งหมดในการตอบสนองคำสั่งที่เกี่ยวกับข่าวสารต่างๆ ซึ่งเท่ากับว่ามีอัตราความล้มเหลวสูงถึง 83%

ตัวเลขดังกล่าวถือว่าแย่กว่าค่าเฉลี่ยความล้มเหลว 62% ของแชตบอตจากค่ายตะวันตก และก่อให้เกิดคำถามว่า เทคโนโลยีปัญญาประดิษฐ์ที่ DeepSeek อ้างว่ามีศักยภาพเทียบเคียง หรือเหนือชั้นกว่า OpenAI ที่มีไมโครซอฟท์สนับสนุนด้วยต้นทุนที่ถูกกว่ากันหลายเท่าตัวนั้น เชื่อถือได้หรือไม่?

หลังเปิดตัวเพียงไม่กี่วัน แชตบอตเอไอของ DeepSeek ได้กลายเป็นแอปพลิเคชันที่ถูกดาวน์โหลดมากที่สุดบน App Store และทำให้เจ้าหน้าที่สหรัฐฯ เริ่มวิตกกังวลว่าความเป็นผู้นำด้านเอไอของอเมริกาอาจกำลังถูกท้าทาย ขณะที่กระแสความบูมของ DeepSeek ยังฉุดราคาหุ้นในกลุ่มบริษัทเทคโนโลยีดิ่งกราวรูดเมื่อวันจันทร์ที่ผ่านมา (27)

ล่าสุด DeepSeek ซึ่งเป็นบริษัทสตาร์ทอัปเล็กๆ ในเมืองหางโจว ยังไม่ออกมาให้ความเห็นตอบโต้รายงานของ NewsGuard

NewsGuard อ้างว่าได้ทำการทดสอบประสิทธิภาพของ DeepSeek ด้วยคำสั่ง (prompts) จำนวน 300 คำสั่ง ซึ่งเป็นชุดเดียวกับที่ใช้ทดสอบประสิทธิภาพของโมเดลเอไอตะวันตกอื่นๆ ในจำนวนนี้มี 30 คำสั่งที่มาจากข้อมูลบิดเบือน 10 เรื่องบนโลกออนไลน์


หัวข้อที่ใช้ทดสอบนั้นมีตั้งแต่ข่าวเหตุการณ์ลอบสังหาร ไบรอัน ทอมป์สัน ซีอีโอของ UnitedHealthcare เรื่อยไปจนถึงอุบัติเหตุการตกของเที่ยวบิน 8243 ของอาเซอร์ไบจานแอร์ไลน์ส

ผลการทดสอบของ NewsGuard พบว่า โมเดลเอไอของ DeepSeek มีการอ้างถึงจุดยืนของรัฐบาลจีนจาก 3 ใน 10 คำสั่ง ทั้งๆ ที่ไม่ได้ถูกถามอะไรเกี่ยวกับจีนเลย

“ความพิเศษของ DeepSeek ไม่ได้อยู่ที่การตอบจุดยืนของรัฐบาลจีนเกี่ยวกับข่าวสารต่างๆ ได้อย่างถูกต้องแม่นยำ แต่เป็นข้อเท็จจริงที่ว่ามันสามารถตอบคำถามอะไรก็ได้ด้วยต้นทุนเพียง 1 ใน 30 ของโมเดลเอไอรุ่นใกล้เคียงกัน” กิล ลูเรีย นักวิเคราะห์จากบริษัทที่ปรึกษาด้านการเงิน D.A. Davidson ให้ความเห็น

NewsGuard ระบุด้วยว่า DeepSeek มีความเสี่ยงสูงเช่นเดียวกันโมเดลเอไออื่นๆ ที่จะผลิตซ้ำข้อมูลเท็จ หากถูกป้อนคำสั่งที่ถูกใช้โดยกลุ่มคนซึ่งพยายามใช้ประโยชน์จากเอไอเพื่อสร้างและเผยแพร่ข้อมูลบิดเบือน

ที่มา : รอยเตอร์
กำลังโหลดความคิดเห็น