身為全球領先、高品質手機遊戲開發與發行公司的網石集團,參與 2021 年度自然語言處理領域的頂級國際會議 EMNLP(Empirical Methods in Natural Language Processing 2021),並在自動後編輯(APE)任務中,成為榮登排名第一的韓國遊戲公司。
每年舉行一次的 EMNLP 是舉世聞名的統計機器翻譯全球會議之一,今年度採取線上方式,於 11 月 7 日至 11 日在多明尼加共和國的蓬塔卡納登場。每一年,EMNLP 均會在機器翻譯的各項領域提供共享任務,包含自動後編輯、新聞翻譯、生物醫學翻譯等。
網石的 APE 系統之所以成功,可歸功於課程培訓策略(CTS)與多任務學習(MTL)。CTS 主要應用於多個訓練階段,使系統學習為後期複雜的問題或目標任務做準備。MTL 則藉由在任務間共享知識與分類相關數據來緩解數據稀疏問題。
「WMT21(2021 Sixth Conference on Machine Translation,第 6 屆國際機器翻譯大賽)中 APE 共享任務的數據質量非常高,但資料集規模還不夠大。為此,我們運用 CTS 與主辦方提供的額外大型資料集來引導性能,而另一關鍵點在於,我們在顯示人工評估指標最佳表現的微調步驟中使用 MTL。」網石 AI 中心團隊經理 Shounan An 說,「網石開發的 APE 系統翻譯錯誤率低,且 BLEU(雙語評估互補)分數高,因此綜合得分超越其他全球優秀的平台公司。」
網石 AI 中心麥哲倫部總監 Oh Insoo 表示,「身為全球手機遊戲開發與發行公司,網石已在多款遊戲中結合 AI 翻譯技術,藉由在後編輯中加入 AI 系統,我們得以優化翻譯質量與時間。」他補充說明:「透過致力於 CTS 和 MTL,我們計劃打造出一個無需人工干預即可準確翻譯的系統。」