xs
xsm
sm
md
lg

เขียนอัลกอฯ สร้างระบบอ่านข้อความจากภาพ ช่วยนักวิ่งมาราธอน

เผยแพร่:   โดย: MGR Online

นายธนานพ กอบชัยสวัสดิ์ นิสิตปริญญาเอก ภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย
นอกจากจะปวดขาหลังวิ่งแบบติดต่อกันมาเป็นเวลานาน อีกปัญหาสำคัญของนักวิ่งมาราธอนสมัยนี้คงหนีไม่พ้นการต้องมาปวดตาเพื่อค้นหารูปตัวเองตามเว็บไซต์ช่างกล้องมืออาชีพต่างๆ ว่าที่ด๊อกเตอร์วิศวะ จุฬา จึงแก้ปัญหาด้วยการเขียนอัลกอริทึม สร้างระบบอ่านป้ายข้อความบนเสื้อผ้าแบบอัตโนมัติ เพื่อให้การค้นภาพแบบเดิมๆ ไม่ยุ่งยากอีกต่อไป

ในมหกรรมประกวดเทคโนโลยีสารสนเทศแห่งประเทศไทย ครั้งที่ 15 ที่จัดขึ้นโดยศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ (เนคเทค) สำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีชีวภาพแห่งชาติ (สวทช.) และหน่วยงานพันธมิตร ที่จัดไปเมื่อช่วงกลางเดือน มี.ค.ที่ผ่านมา มีผลงานนวัตกรรมเด็ดๆ มากมายมาจัดแสดงให้ได้ชม หนึ่งในนั้นได้แก่ผลงาน “การพัฒนาระบบระบุตำแหน่งและรู้จำข้อความบนภาพถ่าย” จากจุฬาลงกรณ์มหาวิทยาลัยที่หยิบโจทย์ปัญหาในปัจจุบันมาแก้ได้อย่างตรงจุด จนได้รับรางวัลชนะเลิศอันดับ 1 ประเภท BEST 2016-Text Localization and Recognition Contest

นายธนานพ กอบชัยสวัสดิ์ นิสิตปริญญาเอก ภาควิชาวิศวกรรมคอมพิวเตอร์ คณะวิศวกรรมศาสตร์ จุฬาลงกรณ์มหาวิทยาลัย กล่าวว่า ระบบระบุตำแหน่งและรู้จำข้อความบนภาพถ่ายที่เขาพัฒนาขึ้นในชื่อว่า “ข้อความเอย เจ้าอ่านว่าอย่างไร” มีจุดเริ่มต้นจากการแข่งขันในเวทีเดียวกันเมื่อปีก่อน ที่มีโจทย์ให้พัฒนาระบบที่ช่วยระบุได้ว่าบนภาพ 1 มีข้อความปรากฏอยู่ตรงส่วนใดบ้าง

ธนานพ เผยว่า ที่โจทย์การแข่งขันเป็นเช่นนั้น เนื่องมาจากปัจจุบันยังไม่มีเทคโนโลยี, แอปพลิเคชัน หรือ วิธีการทางคอมพิวเตอร์ใดที่จะอ่านตัวหนังสือต่างๆ ให้เข้าใจได้ทันที เพราะจะต้องระบุให้แน่ชัดได้ก่อนว่า ข้อความที่จะอ่านอยู่บริเวณใดของภาพ จึงจะประมวลผลเพื่ออ่านข้อความที่ตำแหน่งนั้นๆ ต่อไปได้ ซึ่งโจทย์สำหรับการแข่งขันในปีนี้ เนคเทคก็ยังคงใช้โจทย์เดิมแต่ขยายขอบการสร้างสรรค์เพิ่มขึ้นให้ระบบสามารถใช้งานกับแอปพลิเคชั่นที่จะทำให้การใช้งานง่ายมากขึ้น

เพราะปัจจุบันวงการวิ่งมาราธอนค่อนข้างตื่นตัว มีคนเข้าร่วมเป็นจำนวนมาก ทำให้การวิ่งแต่ละครั้งมีภาพถ่ายจากช่างภาพมืออาชีพ เช่น ชัตเตอร์รันนิง (ShutterRunning) นับหมื่นรูป ซึ่งทำให้การค้นหาภาพของผู้วิ่งยากลำบาก ต้องเสียเวลามากกว่าเดิม เพราะนอกจากการเลื่อนหารูปไปทีละรูปจนกว่าจะเจอ ก็ไม่มีวิธีใดอีกที่จะช่วยอำนวยความสะดวก

ด้วยเหตุดังกล่าว ธนานพจึงคิดแก้ปัญหาด้วยการเขียนอัลกอริทึมเพื่อสร้างระบบระบุตำแหน่งและรู้จำข้อความบนภาพถ่าย ตั้งแต่เดือน พ.ย.2558 และพัฒนามาเรื่อยๆจนถึงปัจจุบัน จนระบบที่เขาคิดค้นขึ้นมีประสิทธิภาพในการระบุข้อความในภาพค่อนข้างสูง ซึ่งจากการวัดระดับความแม่นยำ(Prediction) ที่วัดเปอร์เซ็นความผิดพลาดอยู่ที่ 0.89 และการวัดเปอร์เซ็นความถูกต้อง (recall)อยู่ที่ 0.7 ซึ่งเมื่อนำมาหาค่าเฉลี่ย F score จะทำให้มีค่าอยู่ระหว่าง 0.75 หรือแม่นยำประมาณ 75% ซึ่งจัดอยู่ในเกณฑ์ดีกว่าระบบของต่างประเทศที่มีอยู่เดิม ที่ยังคงทำงานด้วยการประมวลผลแบบหาใบหน้าคนก่อนซึ่งบางครั้งอาจไม่แม่นยำเพราะภาพที่ถ่ายเป็นขณะเคลื่อนไหว ทำให้เกิดการทับซ้อนหรือไม่ชัดเจนซึ่งทำให้การประมวลผลไม่แม่นยำมากพอ

“จะเรียกว่าระบบของผมละเอียดกว่าก็ได้ เพราะผมใช้ทั้งวิธีหาใบหน้าและตัวคน แล้วค่อยเอามาผสมกันแบบแนว Deep Learning ใช้ร่วมกับ Image processing ทำให้เมื่อหาตัวคนได้ก็สามารถหาข้อความบนตัวคนต่อได้ทันทีว่าปรากฏอยู่ตรงไหนบ้างโดยใช้อัลกอริทึมที่ผมพัฒนาจนได้รับการตีพิมพ์ในวารสารวิชาการระดับนานาชาติตั้งแต่ปีที่แล้วมาใช้ประมวลผล พอหาข้อความได้แล้ว เราก็ต้องมาแก้ปัญหาอื่นๆ อีกเพราะบางทีข้อความที่ได้ มีทั้งสิ่งที่ใช่และไม่ใช่ เช่น ผู้วิ่งอาจจะสวมเสื้อที่มีตัวอักษรอื่นซึ่งโปรแกรมต้องมาเลือกว่าจะอ่านค่าของข้อความชุดไหนดี ไม่รวมปัญหายิบย่อยเช่น รูปมืดเกินไป ข้อความเล็กเกินไป เสื้อยับเกินไป ทำให้ต้องแก้ปัญหาด้วยการปรับแก้มุมมอง ปรับแสง ปรับตัวหนังสือให้ชัดเจนมากขึ้น ระบบจะได้ดึงตัวอักษรออกมาอ่านได้อย่างถูกต้อง” ธนานพ กล่าว

หลังจากได้ตัวอักษรหรือตัวเลขออกมา จะนำเข้าสู่กระบวนการรู้จำ (Recognite) ที่เป็นการอ่านให้ออกว่าข้อความนั้นคืออะไร แล้วจึงใช้วิธีแนว Deep Learning อีกครั้ง ให้ตัวเลขหรือตัวอักษรปรากฎและแสดงผลคล้ายกับการออโต้แท็ก ที่จะแสดงผลเป็นรูปภาพได้ทันที หากมีการเสิร์ชชื่อหรือหมายเลขประจำตัวการวิ่ง ทำให้ผู้ใช้ไม่ต้องเสียเวลาค้นหาภาพตัวเองทีละภาพอีกต่อไป ซึ่ง ขณะนี้มีผู้สนใจนำระบบไปใช้บ้างแล้ว โดยส่วนใหญ่เป็นผู้ประกอบการจัดอีเวนต์งานแข่งวิ่ง และช่างถ่ายภาพมือสมัครเล่นที่อยากนำระบบไปใช้กับเว็บไซต์ที่เหมือนเป็นศูนย์รวมของช่างภาพ ที่เวลาช่างภาพนำภาพมาใส่ระบบก็จะแท็กให้เลยโดยอัตโนมัติ

ในอนาคตธนานพ เผยว่า จะต่อยอดไปสู่การสร้างอัลกอริทึม ที่สามารถอ่านภาษาไทยได้ เพราะปัจจุบันอ่านค่าได้เพียงแค่ตัวเลขและตัวอักษรภาษาอังกฤษ ตามความมุ่งหมายของเขาที่ต้องการสร้างอัลกอริทึมภาษาไทย โดยระบบนี้ยังถือเป็นส่วนหนึ่งของวิทยานิพนธ์ในระดับปริญญาเอกของเขา ที่มี ผศ.ดร.ธนารัตน์ ชลิดาพงศ์ เป็นอาจารย์ทีปรึกษา
การแสดงผลจากระบบฯ
ระบบสามารถอ่านตัวเลขบนเสื้อผ้าของนักวิ่งได้อย่างแม่นยำ ทำให้การสืบค้นทำได้ง่าย
แผนผังการทำงานของระบบ
บางครั้งการมีตัวเลขหลายชุด, มีคนหลายคนในภาพเดียว หรือตัวเลขถูกบดบังก็ทำให้ระบบทำงานผิดพลาด
นายธนานพและ ผศ.ดร.ธนารัตน์ ชลิดาพงศ์ อาจารย์ทีปรึกษา







เพิ่มมูลค่าพลอยเกรดต่ำด้วย "ลำไอออน" เทคโนโลยีอนุภาคความร้อนต่ำพลังงานสูงทางเลือกใหม่เอาใจคนรักอัญมณี ให้ประสิทธิภาพดีกว่าการเผา "ใสกว่า-สีสดกว่า-ทุ่นเวลา-ไม่ทำให้พลอยแตก" เพิ่มราคาเศษพลอยไร้ค่าได้ 10 เท่า อ่านต่อเพิ่มเติม www.manager.co.th/science #sciencenews #mgrscience #manageronline #jewelry #ion #chiangmai #university

A photo posted by AstvScience (@astvscience) on



กำลังโหลดความคิดเห็น