พีรเชษฐ ปอแก้ว | สถาบันเทคโนโลยีการคำนวณ (UCAS)

พีรเชษฐ ปอแก้ว (เชษ)
ปริญญาเอก – สถาบันเทคโนโลยีการคำนวณ (Institute of Computing Technology – ICT), University of Chinese Academy of Sciences (UCAS)
ปริญญาโท – Institute of Computing Technology, University of Chinese Academy of Sciences (UCAS)
ปริญญาตรี – คณะวิศวกรรมศาสตร์ มหาวิทยาลัยเชียงใหม่

“ถ้าเปรียบเทียบกับการเล่นกีฬา อาจารย์ที่ปรึกษาเป็นเหมือนโค้ช ส่วนนักศึกษาก็เหมือนผู้เล่น ที่จะต้องฝึกซ้อมความรู้ความเชี่ยวชาญให้ทันต่องานวิจัยใหม่ ๆ อยู่เสมอ”

สวัสดีครับ ผมพีรเชษฐ ปอแก้ว ปัจจุบันศึกษาปริญญาเอกอยู่ที่สถาบันเทคโนโลยีการคำนวณ (Institute of Computig Technology, ICT) มหาวิทยาลัยสภาบัณฑิตวิทยาศาสตร์จีน (University of Chinese Academy of Sciences, UCAS) สาขาที่ศึกษาคือ เทคโนโลยีการประมวลผลภาษาธรรมชาติ (Natural Language Processing, NLP) ซึ่งเป็นสาขาหนึ่งของเทคโนโลยีปัญญาประดิษฐ์ (Artificial Intelligence) หรือเรียกสั้น ๆ ว่า AI นั่นเองครับ

งานวิจัยของผม มุ่งไปทางด้านระบบแปลภาษาอัตโนมัติ ซึ่งเชื่อว่าหลายคนก็คงเคยใช้ระบบแปลอย่าง Google Translate ถ้าย้อนกลับไปสัก 10 ปีก่อน ระบบแปลภาษานี้ยังเรียกได้ว่าอยู่ในช่วงเริ่มต้นการพัฒนา ถ้าใครเคยซื้อโปรแกรมแปลภาษามาใช้จะพบว่า คำแปลนั้นไม่เป็นธรรมชาติ แปลเหมือนเอาคำมาเรียงต่อ ๆ กันไปเรื่อย ๆ ซึ่งตัวผมเองตอนเริ่มเข้ามาศึกษาทางด้านนี้ก็พบปัญหานี้ จึงอยากพัฒนาเทคโนโลยีทางด้านนี้ให้ดียิ่งขึ้นไปครับ

ฟังดูน่าสนใจมากเลยค่ะ อย่างนี้ก็จะต้องป้อนข้อมูลคำศัพท์จำนวนมากให้กับระบบใช่ไหมคะ

ครับ โดยปกติแล้ว ยิ่งมีข้อมูลมาก ระบบปัญญาประดิษฐ์ก็จะทำงานได้ดียิ่งขึ้น แต่ลำพังจะให้นักภาษาศาสตร์ป้อนข้อมูลจากพจนานุกรมเข้าไปเพียงอย่างเดียวนั้นยังไม่พอ อีกทั้งต้องใช้เวลานานมากด้วยครับ ในยุคแห่งข้อมูลข่าวสารในปัจจุบัน เรามีตัวอย่างประโยคจำนวนมาก ทั้งเอกสารราชการที่ได้แปลไว้ บทบรรยายภาพยนต์ และข้อมูลคู่ประโยคที่แจกจ่ายตามเว็บไซต์ต่าง ๆ ซึ่งข้อมูลเหล่านี้ ก็ได้มีผู้รวบรวมและเผยแพร่ไว้อยู่บ้างครับ เราสามารถนำเอาคู่ประโยคคำแปลเหล่านั้น มาฝึกสอนให้คอมพิวเตอร์เรียนรู้การแปลจากภาษาหนึ่งไปอีกภาษาหนึ่งได้

แล้วการสอนให้คอมพิวเตอร์เรียนรู้นั้นต้องทำอย่างไรบ้างคะ เหมือนกับสอนคนปกติหรือเปล่า

ไม่เหมือนการสอนให้ห้องเรียนทั่วไปแน่นอนครับ เพราะคอมพิวเตอร์หรือปัญญาประดิษฐ์นั้น จะถูกฝึกเป็นส่วนย่อย ๆ เช่น งานวิจัยของผม คือ การสอนให้คอมพิวเตอร์สามารถแปลข้อความได้ ดังนั้นระบบปัญญาประดิษฐ์ที่พัฒนาขึ้น ก็จะทำได้เพียงแปลข้อความเท่านั้น ไม่สามารถแปลข้อความจากเสียง หรือจากภาพได้ ซึ่งหน่วยวิจัยที่ผมศึกษาอยู่นั้น มีนักศึกษาท่านอื่น ๆ ที่พยายามขยายความความสามารถให้คอมพิวเตอร์แปลข้อความจากเสียงได้โดยตรง แต่ก็ยังอยู่ในขั้นเริ่มต้นครับ

แสดงว่าเวลาสอนคอมพิวเตอร์ ก็ต้องพิมพ์เพื่อคุยกับคอมพิวเตอร์ไปเรื่อย ๆ หรือเปล่าคะ เพราะระบบยังฟังเสียงไม่ได้

ถ้าเป็นอย่างนั้น ก็คงต้องใช้เวลานานมากเลยครับ กว่าจะสอนให้คอมพิวเตอร์แปลภาษาได้ สิ่งที่ทำให้คอมพิวเตอร์แปลได้ คือ การสร้างแบบจำลองทางคณิตศาสตร์ เช่น ระบบแปลภาษาเชิงสถิติ ใช้หลักการของความน่าจะเป็นเพื่อสร้างองค์ความรู้ที่จะบอกว่า ความน่าจะเป็นของคำว่า Beijing จะแปลว่า ปักกิ่ง มีค่าเป็นเท่าไหร่ โดยดูจากคลังคู่คำแปลที่เป็นตัวอย่างจำนวนมาก ๆ เมื่อเรามีฐานข้อมูลสถิติตรงนี้แล้ว ก็จะสามารถแปลประโยคโดยการหาประโยคผลลัพธ์ที่มีความน่าจะเป็น ที่จะเป็นคำแปลของประโยคต้นทางที่สูงที่สุดออกมาได้ ซึ่งการฝึกสอนคอมพิวเตอร์แต่ละครั้งก็อาจจะกินเวลาหลายชั่วโมง หรืออาจจะเป็นสัปดาห์เลยทีเดียวครับ

ตอนนี้ พี่เชษฐ สอน AI ให้แปลภาษาอะไรคะ 

ตอนปริญญาโท ผมทดลองสร้างระบบแปลภาษาไทย-จีนครับ เพราะระบบแปลภาษาที่ให้บริการส่วนใหญ่ จะแปลภาษาไทยเป็นอังกฤษก่อน แล้วจึงแปลอังกฤษเป็นจีนอีกครั้ง ทำให้ผลการแปลคลาดเคลื่อนได้ง่าย ผมจึงคิดว่า ถ้าแปลไทยเป็นจีนโดยตรง ไม่ผ่านภาษากลางเลยน่าจะได้ผลดีครับ

ส่วนงานปริญญาเอก คือ การต่อยอดงานวิจัยโดยไม่อิงกับภาษาครับ เป็นงานที่ท้าทายมากเพราะเราต้องพัฒนาอัลกอริทึมให้ใช้ได้ดีกับหลาย ๆ ภาษา ทำให้ต้องอ่านงานวิจัยเชิงลึกและเป็นสมการทางคณิตศาสตร์ที่ยากขึ้น

มีให้ทดสอบใช้ไหมคะ

มีครับ สำหรับระบบแปลภาษาไทย-จีน เป็นส่วนหนึ่งของโครงการ AI for Thai โดยสำนักงานพัฒนาวิทยาศาสตร์และเทคโนโลยีแห่งชาติ (สวทช.) ซึ่งงานวิจัยระบบแปลภาษาไทย-จีน ก็ได้รับการสนับสนุนจากหลายหน่วยงานทั้งจากไทยและจีน สามารถดาวน์โหลดได้ผ่านทาง Google Play Store โดยใช้ชื่อแอพพลิเคชั่นว่า XiaoFan ครับ

เราใช้แอพนี้คุยกับคนจีน ได้เลยใช่ไหมคะ

ครับ แต่ก็ยังต้องใช้อย่างระมัดระวังด้วยนะครับ เพราะสิ่งที่คอมพิวเตอร์เรียนรู้นั้น มาจากข้อมูลสาธารณะ ซึ่งหากมีคนให้ข้อมูลผิด ๆ ไปก็จะทำให้ผลลัพธ์ที่ออกมาผิดไปด้วยครับ

อยากให้เล่าถึงบรรยากาศการเรียนที่มหาวิทยาลัย เป็นอย่างไรบ้างคะ

สถาบันวิจัย ICT ที่ผมศึกษาอยู่นี้ เป็นส่วนหนึ่งของ Chinese Academy of Sciences ครับ ซึ่งเป็นสถาบันวิจัยภายใต้กระทรวงวิทยาศาสตร์และเทคโนโลยีของจีน แต่ละปี จะผลิตนักวิจัยจำนวนมากทั้งระดับปริญญาโท และเอก อย่างรุ่นผมตอนปริญญาโทก็จะมีราว ๆ สี่ร้อยคนที่จบพร้อมกัน รูปแบบการเรียนก็จะคล้าย ๆ กันสถาบันอื่น ๆ ในจีนครับ

ถ้าเปรียบเทียบกับการเล่นกีฬา อาจารย์ที่ปรึกษาเป็นเหมือนโค้ช ส่วนนักศึกษาก็เหมือนผู้เล่นที่จะต้องฝึกซ้อมความรู้ความเชี่ยวชาญให้ทันต่องานวิจัยใหม่ๆ อยู่เสมอ ทุกสัปดาห์ จะต้องนำเอางานวิจัยที่น่าสนใจมาแลกเปลี่ยน ซักถาม และอัพเดตความก้าวหน้างานวิจัยของแต่ละคน อาจารย์จะคอยกำหนดทิศทางและช่วยดูความสมบูรณ์ของงานวิจัยที่เราได้ทำออกมา อาจจะมีงานที่นอกเหนือจากงานของเราบ้างอย่าง เช่น ไปติดตั้งระบบแปลภาษาให้กับหน่วยงานอื่น ๆ หรือพัฒนาระบบภายใต้ความร่วมมือกับสถาบันวิจัยอื่น ๆ ครับ

ทราบว่า พี่เชษฐเคยนำเสนอผลงานต่อสมเด็จพระกนิษฐาธิราชเจ้า กรมสมเด็จพระเทพรัตนราชสุดาฯด้วย

ใช่ครับ ผมได้ร่วมถวายรายงานความคืบหน้าของการพัฒนาระบบแปลภาษาไทย-จีนอย่างเป็นทางการ 2 ครั้ง ครั้งแรก คือ ก่อนที่ผมจะมาเรียนที่จีน ซึ่งหน่วยงานของผมคือ ศูนย์เทคโนโลยีอิเล็กทรอนิกส์และคอมพิวเตอร์แห่งชาติ สวทช. และหน่วยงานจีน คือ สถาบันวิจัย ICT ที่ผมศึกษาอยู่นี้ มีความร่วมมือกัน ซึ่งสมเด็จพระกนิษฐาธิราชเจ้า กรมสมเด็จพระเทพรัตนราชสุดาฯ สยามบรมราชกุมารี ท่านได้เชื่อมความสัมพันธ์ไว้ก่อนหน้านี้ จึงทรงมีพระราชดำริให้โครงการนี้เป็นงานภายใต้โครงการของพระองค์ท่าน

ครั้งที่สอง ท่านเสด็จเยือนสถาบันวิจัยเทคโนโลยีการคำนวณ ใช้เครื่องโน๊ตบุ๊คของผมเป็นเครื่องทดสอบ ท่านป้อนประโยคทดสอบว่า “เมื่อคืนกรุงเทพฝนตกหนักมาก” แต่ระบบแปลออกมาไม่ครบ แปลออกมาเพียงว่า 昨晚雨下得很大 คือ “เมื่อคืนฝนตกหนักมาก” ขาดคำว่า “กรุงเทพ” ไป

ถึงแม้จะหน้าแตกเพราะระบบแปลไม่ถูกต้อง แต่สิ่งที่ผมได้รับ คือ ณ วันนั้น ถึงแม้พระองค์ท่านจะอยู่ต่างประเทศ แต่ท่านยังคงคิดถึงเมืองไทย ถ้าเป็นพวกเราทดสอบก็คงเลือกประโยคอย่างเช่น “ฉันอยากไปพระราชวังต้องห้าม” หรือ “รถไฟฟ้าใต้ดินไปทางไหน” อะไรทำนองนั้น

ตอนนี้ ระบบแปลคำว่า “กรุงเทพ” ได้หรือยังคะ

(หัวเราะ) ต้องไปลองครับ ผมได้เตรียมวิธีสำหรับใส่ชื่อสถานที่ต่าง ๆ ไว้แล้วครับ เพราะอนาคตอาจจะนำไปใช้กับสถานที่ท่องเที่ยวในไทย ชื่ออาหารไทย ชื่อประเพณีวัฒนธรรมไทยต่าง ๆ ตรงนี้เราได้ทำฐานข้อมูลเฉพาะให้กับระบบไว้อยู่ครับ

ดีมากเลยค่ะ ถ้าระบบเสร็จแล้วน่าจะเป็นประโยชน์ต่อทั้งชาวไทยและชาวจีนเลยนะคะ

ครับ ก็หวังว่างานตรงนี้จะได้ใช้ให้เกิดประโยชน์ต่อไปในอนาคตได้ครับ ผมเองที่ได้มาเรียนที่นี่ก็เพราะทุนรัฐบาลไทย ถ้าหากงานวิจัยที่ทำออกมามีประโยชน์กับคนไทยก็จะดีใจมาก ๆ ครับ ถือว่าได้นำความรู้กลับมาทำประโยชน์ได้ ทุกวันนี้โลกไร้พรมแดน ความรู้ต่างๆ บางครั้งไม่ได้อยู่ในภาษาไทยหรือภาษาอังกฤษเพียงอย่างเดียว ความรู้อันเป็นภูมิปัญญาของชาวจีนก็มีคุณค่าและเป็นมรดกตกทอดมาหลายพันปี ดังนั้นหากมีระบบที่ทำให้เราสามารถเข้าใจภาษาจีน ๆ ได้ง่ายขึ้น เราก็จะสามารถเรียนรู้วัฒนธรรมของกันและกันได้ดียิ่งขึ้นครับ

อัพเดทล่าสุด

Facebook

ติดตามเราบน Facebook

Youtube

ติดตามเราบน Youtube

ฝ่ายวิทยาศาสตร์และเทคโนโลยี ประจำสถานเอกอัครราชทูต ณ กรุงปักกิ่ง กระทรวงการอุดมศึกษา วิทยาศาสตร์ วิจัยและนวัตกรรม (อว.)
เลขที่ 21 ถนนกวงหวา เขตฉาวหยาง กรุงปักกิ่ง 100600 สาธารณรัฐประชาชนจีน อีเมล : [email protected]

© 2020-2024 Science and Technology Section, Royal Thai Embassy in Beijing Ministry of Higher Education, Science, Research and Innovation, 21 Guanghua Road, Chaoyang District, Beijing 100600 P.R.C. E-mail: [email protected]