朱靖波:輔助翻譯技術需「以人為本」


觀點 | 朱靖波:輔助翻譯技術需「以人為本」

編者按:朱靖波教授是小牛翻譯創始人、東北大學計算機學院教授,為國內外著名的機器翻譯學者。在本文中,朱靖波教授反思了當前機器翻譯技術所帶來的“譯後編輯”模式(即人工翻譯過程變成糾錯校對後編輯過程)的不足之處,並提出機器翻譯研究應嘗試開發“以人為本”的輔助翻譯技術。

當前,機器翻譯技術大多是從技術本身出發,考慮的視角一般是普通人,但卻忽略了對機器翻譯有較強需求的人工翻譯人員的需求,導致譯員在藉助機器翻譯進行譯後編輯過程中,存在一系列矛盾之處。“以人為本”的輔助翻譯技術,即從譯員的角度考慮他們真正需要哪些幫助。這種觀點是一種研發視角的思想變革。

自從上個世紀四十年代計算機誕生之時,機器翻譯就成為大家首先想到的計算機應用之一,幫助解決人工翻譯代價高、效率低的問題。機器翻譯技術經過幾十年的發展,翻譯能力越來越強,從基於規則的方法、統計機器翻譯技術到現在主流的神經機器翻譯技術,對人工翻譯的“降本提效”方面幫助越來越大。前一段時間甚至引發機器翻譯代替人工翻譯的爭論,經過這兩年的討論,大家各自心裡都有自己的評判,至少從原先的對立性觀點,慢慢轉變成為共存性觀點。我寫本小文的目的不是為了討論這個問題,而是想分享一下我對機器翻譯如何幫助人工翻譯的一些想法。

利用機器翻譯幫助人工翻譯,通常稱之為輔助翻譯技術(CAT),也可以叫作機助人譯。也有人在研究人助機譯技術,這個不是本文討論的重點,但我覺得兩者可以有機融合,相互促進,共同受益,也是一個有趣的話題。

回到傳統輔助翻譯技術話題,暫時拋開不討論翻譯記憶技術(Translation Memory),基本思想是保留之前翻譯好的數據,採用檢索的技術,避免重複翻譯的工作,對於經常翻譯特定任務的人工翻譯來說,幫助是挺大的,比如翻譯汽車手冊,不同版本的手冊重複度可能達到60%以上,可以大大降低人工翻譯代價。翻譯記憶的技術充分發揮了計算機的存儲檢索優勢,最大的問題就是檢索匹配過程比較嚴格,翻譯記憶庫的覆蓋度大小決定了使用效果,特別是初期還沒有大規模的翻譯記憶庫的時候。

目前很自然想到的機器翻譯輔助人工翻譯的應用模式是譯後編輯,基本方法非常簡單,人工對機器翻譯結果進行糾錯校對和後編輯。從理論上來說,如果機器翻譯輸出的譯文質量高,可以大大降低人工翻譯後編輯的代價。換句話說,對人工翻譯的幫助效果完全依賴於機器翻譯的譯文質量好壞。從實際應用來看,在很多特定領域的翻譯任務中,機器翻譯的譯文質量沒有達到人工譯員的期望,因為很多時候機器翻譯系統的構建是通過通用領域雙語數據構建的,當然基於特定領域的雙語數據構建的機器翻譯系統,譯文翻譯品質有可能提升10%甚至更高,這樣的話,對人工翻譯的幫助會更大。

機器翻譯的表現有點不同於人工翻譯,比如在翻譯一篇文章的時候,經常會出現有些句子翻譯很好,有些句子翻譯質量不好。當人工翻譯看到一篇混合翻譯質量好與不好的譯文,也會大大降低人工譯員對機器翻譯的好感。所以從應用角度來看,如何對機器翻譯譯文質量自動評價,比如用不同顏色標註不同質量的譯文句子,人工譯員可以選擇高質量譯文句子進行後編輯,忽略質量不好的譯文句子,也是一種可以考慮的選擇。

譯後編輯工作模式的另一個問題是改變了人工譯員的翻譯習慣,將人工翻譯過程變成糾錯校對後編輯過程。嚴格上來說,這是一個弊端,對於不同年齡的譯員來說,接受度可能是不一樣的,也許年輕的譯員接受度會好一些,對於資深譯員來說,接受度會差很多。另外還有一點,機器翻譯的譯文就算正確,由於翻譯是一個具有藝術性的工作,每個譯員也許擁有不同的翻譯風格,涉及到用詞和句子結構選擇,因為一個句子實際上會存在很多種不同的正確翻譯結果,所以有信達雅三個層次的翻譯水平。特別是針對一些高水平翻譯來說,不是簡單譯文能夠準確表達原文意思就可以的,比如詩歌翻譯需要講究境界。我猜想高水平譯員對於翻譯也有不同的態度,對於譯文的質量要求也不同,所以完全改變他們的翻譯習慣,缺乏參與性,只是簡單糾錯校對工作,也會讓他們大大降低使用機器翻譯的興趣。

機器翻譯還面臨一個更大的實際問題,因為機器翻譯系統都是事先訓練好的,目前缺乏非常有效的強大反饋學習能力,比如譯員修改了機器翻譯譯文錯誤,下次翻譯的時候,機器翻譯還會犯同樣的錯誤,當然可以引入添加用戶術語詞典來優化機器翻譯品質,但這個能力非常有限,主要能力只能體現在術語翻譯本身,對於句子結構翻譯錯誤、省略翻譯錯誤、重複翻譯和漏譯等問題無效。所以如何讓機器翻譯能夠自動學習譯員的糾錯信息來優化翻譯品質,這個一個非常值得研究的課題。

前面提到不同人工譯員的譯文風格可能會有所不同,這就導致要求所有譯員基於同一種譯文風格(同一套機器翻譯的譯文風格)進行修改後編輯,有時候也是非常痛苦的事情。曾有人提出一個問題,機器翻譯能否通過自學習機制,讓自動翻譯結果的譯文風格慢慢吻合使用者(譯員)的譯文風格呢?這個也是非常有趣的話題,也許值得進一步研究。

除了譯後編輯工作模式外,機器翻譯還有另外一種方法來幫助人工翻譯,我們稱之為交互式機器翻譯。主要動機是希望儘量不改變人工翻譯習慣來使用機器翻譯服務。舉個簡單例子,人工翻譯一個長句子的時候,比如從左到右翻譯,當人工翻譯一部分片段的時候,將人工翻譯的(部分)譯文作為約束條件作為輸入,要求機器翻譯結果保持人工翻譯結果前提下,給出其它未翻譯部分的譯文。當然交互式機器翻譯的實現方法可能還有很多,基本思想就是充分尊重人工翻譯結果的前提下,儘可能提供機器翻譯幫助。從理論上來說是非常有趣的,但其中涉及到操作模式的用戶體驗問題,再加上每個人工翻譯過程是否嚴格遵循從左到右翻譯等等,如何設計一個良好的交互式機器翻譯用戶體驗,好像不是非常容易。

直覺上來說,譯後編輯工作模式可以作為交互式機器翻譯的特例,相對來說,一種具有良好用戶體驗的交互式工作模式容易被譯員所接受。其實對於譯員來說,翻譯水平也有高低,對於輔助翻譯工具的要求也有不同,簡單打個比方,就算機器翻譯給出一個譯文,如何判斷這個譯文質量好話,也是一個挑戰。如果譯員認為機器翻譯譯文質量好,也許可以採納,否則就拒絕,前提是他能夠準確判斷質量好壞。另外對於譯員來說,有時候需要更多的翻譯輔助能力,比如查找一些更好的單詞譯文、短語譯文和譯文結構選擇,也許希望推薦一個高質量的例句等等,總之,除了機器翻譯技術本身,交互式機器翻譯的關鍵在於如何設計一個用戶體驗良好的交互模式。

其實如何評價機器翻譯對人工翻譯的作用,這個也是不太容易回答的問題。是不是能夠提供質量好的譯文,就說明有幫助呢?好像也不一定。兩個譯員可能對機器翻譯的輔助翻譯能力也有不同的期望和需求,這一點不能簡單從機器翻譯技術好壞角度來分析,甚至有可能因人而異,這個就不容易討論清楚了。總之絕對沒有那麼簡單的說,機器翻譯品質提高了,對人工翻譯的幫助就更大了。這個觀點好像是對的,也好像不對,感覺有點怪怪的。

有時候我就想到每天回家陪孩子學習。每個孩子的學習能力和基礎是不一樣的。我們可能將小孩找補習班,假定補習班老師水平是沒有問題的,如果簡單灌鴨式或者不因人而異,補習的效果不太容易達到預期的效果。從這個角度來說,我有個想法,是否存在一種“以人為本”的輔助翻譯技術?機器翻譯能夠幫助人工翻譯,這一點大家都不會有太多疑問,關鍵是如何幫助,如何實現更好的輔助翻譯過程?

目前我們研究譯後編輯和交互式工作模式,大多時候都是從技術本身出發考慮更多,我們也許應該多問問譯員,他們需要哪些幫助,體現以人為本的輔助翻譯能力。舉個例子,有些譯員在翻譯一篇文章的時候,如果事先提供一篇機器翻譯譯文,先閱讀一下,快速瞭解原文的內容,就算後續沒有采用譯後編輯和交互式機器翻譯模式,也可能會提高翻譯效率,降低翻譯代價,這個也是可能的。畢竟人的精力是有限的,連續工作一天的人工翻譯工作,也會非常疲勞,有了機器翻譯譯文作為參考,也許可以降低工作強度,減少疲勞。

問題是如何體現“以人為本”呢?機器翻譯結果作為參考譯文,還是作為初稿譯文,還是作為候選譯文,提供給譯員呢?還是說機器翻譯作為一個輔助工具,譯員需要的時候可以激活使用,也可以不激活。上面提到的,也許譯員有些時候需要查單詞幫助,有些時候需要查相似句子譯文作參考。如果不是為了快速翻譯賺錢目的,作為一個職業譯員來說,肯定不願意簡單充當一個幫助別人修改譯文的角色,這個別人在這裡就是機器翻譯。也許人工譯員對機器翻譯結果還有一個信任度的問題。

目前從事人工翻譯的譯員也許不止幾百萬乃至幾千萬,所需要翻譯的資料是海量的,人工翻譯的代價比較高,降低成本提高效率,肯定是非常有價值的。但最大的問題是機器翻譯譯文無法保證完全正確,只有通過人工譯員校對才有可能。所以如何以人為本輔助翻譯,還是機助人譯,如何讓人工譯員能夠更好受益於機器翻譯,還存在大量挑戰性問題等待深入研究。一旦取得新的突破,理論價值和應用價值值得大家期待!

朱靖波教授:

觀點 | 朱靖波:輔助翻譯技術需「以人為本」

朱靖波博士,小牛翻譯創始人、東北大學計算機學院教授、博士生導師、遼寧省語言智能技術創新中心主任、訊飛AI大學首批特聘教授、中國中文信息學會常務理事。曾入選教育部新世紀優秀人才計劃和遼寧省百人層次人才計劃。1992年開始從事語言分析和機器翻譯理論研究工作,發表了200多篇研究論文和一本清華大學出版的專著《自然語言理解》。

曾在香港城市大學和美國南加州大學USC/ISI做過訪問學者,師從前國際計算語言學學會ACL主席、前國際機器翻譯學會主席、Google翻譯創始人Franz Joseph Och的博士後導師Prof. Eduard Hovy。主持研製的機器翻譯開源系統NiuTrans,免費共享給全球70多個國家3000多個研究機構,2016年榮獲國內自然語言處理領域最高科技獎—錢偉長中文信息處理科學技術一等獎。擁有20多項國內和美國發明專利,研究成果多次獲得遼寧省科學技術一等和二等獎。主持研製的小牛翻譯支持近200種語言互譯能力,全球唯一覆蓋一帶一路和聯合國所有會員國官方語言的機器翻譯系統,為科大訊飛、金山、小米、華為、國家知識產權局等上百家企事業單位提供機器翻譯技術支持與服務。


觀點 | 朱靖波:輔助翻譯技術需「以人為本」



分享到:


相關文章: