OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

生活中難免遇到一些英文翻譯的東西,比方說藥品的說明書,還有家裡小朋友的英語課本等等。對於沒有英文基礎的朋友來說,這些看起來像看"天書"一樣。不要著急,今天我們就給大家帶來一個小技巧,就是“機器翻譯”。所謂機器翻譯顧名思義就是利用計算機將一種自然語言轉換為另一種自然語言的過程,而其核心就是能翻譯且表達出正確的含義。

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

其實在過去幾年,包括OPPO、華為、小米在內的諸多智能手機都搭載了各種翻譯功能,給我們的生活帶來額極大方便,而在每年的全國機器翻譯大會(CCMT2020)上,諸多品牌都會參加翻譯評測,值得注意的是,全國機器翻譯大會是由中國中文信息學會機器翻譯專委會定期舉辦的全國年度學術會議,至今已成功舉辦16屆,並組織了9次機器翻譯評測,是國內機器翻譯領域最有影響力,最權威的學術會議和評測賽事之一,最關鍵是在大會上除了外文翻譯,還包括國內各種少數民族語言的發佈。

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

2020年10月10日-12日,第十六屆全國機器翻譯大會在線上召開,此次大會吸引了包括OPPO、騰訊、同花順、清華大學、北京理工大學、南京大學在內20餘支知名企業和高校參與,整個比賽覆蓋了雙語機器翻譯(英漢、漢英、多語言翻譯、維漢、藏漢、蒙漢)、語料過濾(漢英)、語音翻譯(漢英、英西)和翻譯質量自動評估(漢英、英漢)等任務,這也是目前機器翻譯領域裡熱門的幾個研究方向。

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

隨著比賽的落幕,各大獎項也相繼出爐,來自智能手機行業的OPPO繼去年參賽並獲得了兩條賽道的冠亞軍後,今年又取得了六項冠軍、一項亞軍的優異成績,力壓騰訊、清華等超級巨頭。具體說來,OPPO參加了雙語機器翻譯和語料過濾任務,在英漢、漢英、多語言、維漢、藏漢翻譯和語料過濾(5億詞規模)這6個方向均斬獲第一名,在蒙漢翻譯賽道獲得第二名。值得注意的是,OPPO在參加的所有賽道中提交的系統都是受限系統。

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

CCMT2020 6條翻譯賽道系統評測結果

OPPO之所以能夠取得如此出色的成績,最主要當然還是起出色的的翻譯技術。在本次比賽中,面對不同任務的數據特點,OPPO機器翻譯團隊設計了不同的數據處理和清洗流程,同時在業界最先進的Transformer神經翻譯網絡架構基礎上,結合業界領先的多種數據增強技術和模型蒸餾方法,通過多維度的特徵對結果進行重排序,以提升翻譯質量。

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

正是這一系列的技術加持,使得OPPO翻譯技術人團隊在低資源賽道上(維漢、藏漢、蒙漢)使用多任務學習的思想,通過混合不同分詞結果和不同粒度的輸入,來訓練模型,進一步提升了翻譯結果的準確性,這些探索也落地應用在OPPO在線翻譯引擎中。

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

一直以來,OPPO在圍繞多個關鍵技術進行著自主研發工作,並在積極佈局機器翻譯這一人工智能場景中的重要技術,並通過技術、硬件以及操作系統的打通,為消費者帶來綜合體驗更優異的終端產品。而OPPO機器翻譯團隊在組建後的短短兩年間裡,不僅完成了團隊從無到有的建設,而且在國際國內各項賽事中取得了出色的成績。

OPPO翻譯技術團隊再立功!國內奪冠驗證技術,早已落地商用

值得注意的是,OPPO的翻譯技術不僅僅停留在技術層面,目前已經實現了大規模的商用。例如OPPO自家操作系統ColorOS中的拍照翻譯功能,相機拍攝外文即可即時顯示翻譯,為使用者帶來便利。相信未來OPPO將會為我們帶來更多適用於不同使用場景以及更具想象力的翻譯功能,還是非常令人期待的。


分享到:


相關文章: