前方高能,同聲翻譯的福音來了!

家住上海松江區的老劉是一位從業5年的同傳工作者,談起自己的工作經歷,老劉用了"水深火熱"四個字。

老劉說,'"同傳"的壓力很大程度上來自"無法預料"。因為,"同傳"在國際會議上用得最多,國際會議會涉及不同的領域和行業,由於不同國家背後不同的文化背景,不同的發言人也有各自的表達方式和思維習慣,即使同一種語言,卻也存在不同的口音。

他分析道,同傳不僅需要經驗,更需臨場的發揮,充分精神集中,調動所有的語言和知識儲備。這也正是同聲傳譯需要兩人以上協作,需要換崗的原因。但即便如此,超過35歲再做這個行業也很難應付了,而且年紀越大越吃力。

針對於市場對同傳人員用人難的需求,人們研發出了機器同傳,用機器來代替人類翻譯的過程從而達到結果。運用語音識別技術自動識別演講者的講話內容,把語音轉化為文字,然後調用機器翻譯引擎,將文字翻譯為目標語言,顯示在大屏幕或者通過語音合成再播放出來。

有了機器同傳的出現,一定程度上減少了翻譯人員的超負荷工作量。但是在人工智能領域,兩種語言的"即時互譯"是一項難以攻克的技術問題,主要原因在於源語言和目標語言之間存在較大的詞序和語序差異。

前方高能,同聲翻譯的福音來了!

這種語序上的差異經常會使得整個語言環境與原句原意發生嚴重錯亂,以至於常常出現尷尬的情況。

現在,百度針對機器同傳遇到的這些瓶頸,提出了一些解決方案。

1、提前預測能力

前方高能,同聲翻譯的福音來了!

我們從這張動圖上可以看到,上面的中文是人類說的話,下面的英文是百度 AI 給出的實時翻譯。可以看到,沒等說到"莫斯科"的時候,AI 自動翻譯的英語就已經出現了"meet",也就是漢語句末的"會晤"。

百度運用人類同傳譯員常用的一個技巧就是"合理預測":在發言人話說到一半時,預測到後半句可能要講的內容,超前翻譯,這樣能使同傳又快又準。

百度的工程師們巧妙地模仿這一點,研發出了"wait-k words"模型,讓機器同傳也擁有了"合理預測"的能力,一定程度上解決了上面所說的"準確度與速度不可兼得"的問題。

普通的 AI 同傳是一整句話說完之後才進行翻譯,而百度同傳沒等說完前半句,它的"大腦"就會瞬間做出反應,堪稱"讀心術"!

前方高能,同聲翻譯的福音來了!

這是百度同傳的"讀心術"現場,當說到"百度在18年前"時,AI 就預測出了"started a business"

2、不斷學習專業知識

像老劉描述的一樣,人類同傳譯員在接到翻譯任務後,通常會提前很多天學習相關知識,進行"備課",為的就是更好地應對陌生詞彙而臨危不懼。

百度工程師們模仿了這一準備過程,讓機器同傳也能通過快速融合領域知識策略,快速學習專業知識,提前"備課"。

當 AI 同傳接到某一個領域的翻譯任務時,系統會收集該領域數據並在通用模型的基礎上進行增強訓練,最後對該領域術語庫進行強制解碼,使專業術語翻譯得準確可靠,且提升翻譯效率。

3、更準確的語音識別

區別於傳統的上下文相關建模技術,百度推出了上下文無關音素組合的中英文混合建模單元,包含1749個上下文無關中文音節和1868個上下文無關英文音節。具有泛化性能好、對噪聲魯棒、中英文混合識別等特點,很好的解決了老劉所描述的同傳難題。

4、更強的容錯能力

對於語音識別模型常犯的錯誤,在訓練數據的時候加入噪聲數據,讓模型在接收到錯誤的語音識別結果時,也能在譯文中糾正過來。

前方高能,同聲翻譯的福音來了!

比如,語音識別系統將"大堂"錯誤地識別為"大唐",這一對噪聲詞被收錄到訓練數據裡,再把源語言句子"我們在酒店大堂見面吧"替換為"我們在酒店大唐見面吧",而保持目標語言翻譯不變"Let's meet at the lobby of the hotel",同時將這兩個中文句子存儲在它的"大腦"裡面,以後再出現類似的情況會更輕鬆地解決!

5、不知疲倦的翻譯

和"老劉們"相比,機器最大的優勢是不會因為疲倦而導致譯出率下降,能把所有"聽到"的句子全部翻譯出來,這讓機器的"譯出率"可以達到100%,遠高於人類譯員的60%-70%。

我們詢問了百度工程師研發AI同傳的目的,他們說:AI同傳的出現並不是取代人類譯員,而是為了降低同傳成本,讓同傳的應用範圍更加廣泛。

AI同傳的出現會一定程度的減輕"老劉們"工作上的一些麻煩,但是我們相信科技的進步只會給人們生活帶來方便。在未來,希望AI技術能出現在不同的領域為我們提供便利,我們一起拭目以待!


分享到:


相關文章: