Google 翻譯有更新!能離線說人話了,但還是有點智障

去年 3 月,Google 翻譯成為我們目前在國內可以正常使用的 Google 應用。現在這個 App 又有新變化,要變得更好用了。

近日 Google 宣佈,將在 iOS 以及 Android 的 Google 翻譯軟件上加入離線神經網絡機器翻譯(NMT,Neural Machine Translation),也就是說,下載了離線的資源包後,在沒有網絡的情況先下,Google 翻譯也會說人話啦,而不是逐個詞語地生硬翻譯。

這次 Google 翻譯提供了包括中文在內 59 種語言的離線翻譯包。我們選擇下載了中文翻譯離線包,同時找了一些英文語段,試了在聯網以及離線的情況下,翻譯有哪些變化。

Google 翻譯有更新!能離線說人話了,但還是有點智障

加入了 NMT 的 Google 翻譯,真的變聰明瞭嗎?

不知道你之前是否發現,在聯網和離線的情況下,用 Google 翻譯出來語句是有差異的?那是因為在不同的平臺,Google 使用了不同的翻譯技術。

因此我讓 Google 翻譯分別在聯網、離線沒有 NMT、離線擁有 NMT 的三種情況,對古詩詞、新聞報道、經典臺詞以及日常用語,進行了四個回合的翻譯能力對比。從信達雅的角度進行打分,滿分為 5 分。

同時將它們翻譯出來的內容,放在網頁版的 Google 翻譯中,看是否能夠還原翻譯前的意思。

第一回合:翻譯李白的一句古詩

比如我找到了李白《將進酒》中的這一句用來翻譯:「君不見,黃河之水天上來,奔流到海不復回。」

Google 翻譯有更新!能離線說人話了,但還是有點智障

▲ 從左往右分別是:聯網,離線未更新 NMT,離線使用 NMT

聯網時的翻譯是:

Do not you see, the waters of the Yellow River come to heaven, running to the sea will not return.

點評:滿分 5 分,得分為 4 分。因為意思相對完整,「黃河」的翻譯首字母都用上了大寫,真是細緻,基本沒有語法錯誤,還相對淺顯易懂。

沒有更新 NMT 前的離線翻譯是:

Do not you see, yellow River water heaven, torrent to sea not re-back.

點評:真的是逐字翻譯,語法錯誤明顯。 2 分。

更新 NMT 後的離線翻譯是:

Junski, the yellow river on the day, run to the sea is not replicated.

點評:Google 翻譯的人工智能,把「君不見」識別為一個人名,並且翻譯成了「Junski」。語法錯誤明顯,曲解詩句原意。1.5 分。

這一回合,只有聯網時的翻譯可以還原翻以前的意思。

第二回合:翻譯新華社的一段新聞

我找到了新華社 6 月 14 日,一篇題目為《5 月份主要數據反映中國經濟運行穩健》的第一段:「國家統計局 14 日發佈的數據顯示,5 月份,國民經濟繼續保持總體平穩、穩中向好發展態勢,生產需求基本平穩,就業持續向好。」

Google 翻譯有更新!能離線說人話了,但還是有點智障

▲ 從左往右分別是:聯網,離線未更新 NMT,離線使用 NMT

聯網時的翻譯是:基本沒有語法錯誤。5 分。

沒有更新 NMT 前的離線翻譯是:逐字翻譯無疑,「14 日」翻譯有誤,語法錯誤明顯。 2 分。

更新 NMT 後的離線翻譯是:「五月份」這個翻譯有誤,離線情況下也有使用句子的方式來翻譯。3 分。

Google 翻譯有更新!能離線說人話了,但還是有點智障

▲ 使用離線 NMT 翻譯的語句,第一個分句在還原時有誤

這一回合,最後在網頁版的 Google 翻譯中,對這三段英文譯文進行還原時,前兩個都能還原出句子原來的意思,但是使用離線 NMT 翻譯的語句,第一個分句不能並被網頁版的 Google 翻譯正確還原。

第三回合:翻譯一句簡單的美劇臺詞

《神探夏洛克》第一季第一集裡,有一句經典的臺詞:「You, don’t talk out loud. You lower the IQ of the whole street. You, face the other way. You are putting me off. 」

Google 翻譯有更新!能離線說人話了,但還是有點智障

▲ 從左往右分別是:聯網,離線未更新 NMT,離線使用 NMT

聯網時的翻譯是:

你,不要大聲說話。你降低了整條街道的智商。你,面對另一種方式。你讓我失望。

點評:4 分。結構整齊,但有一個分句翻譯出錯。

沒有更新 NMT 前的離線翻譯是:

你,不說話出聲來。您降低 iq 的整個街。你,臉的其他方式。你是把我關閉。

點評:1 分。這一句的翻譯,簡直是拉低了 Google 的智商。

更新 NMT 後的離線翻譯是:

你不要喊出大聲。 你降低整個街道的智商。 你面對另一方面。 你把我放在了

點評: 2 分。前半部分翻譯正確。但是後一部分就不行了,最後話說到一半就結束了,你想學習人類的欲言又止嗎?

Google 翻譯有更新!能離線說人話了,但還是有點智障

這一回合的結論是,在不聯網的情況下,Google 翻譯都拉低了 Google AI 的智商。

第四回合:翻譯一句生活日常用語

「游泳健身,瞭解一下。」

Google 翻譯有更新!能離線說人話了,但還是有點智障

▲ 從左往右分別是:聯網,離線未更新 NMT,離線使用 NMT

聯網時的翻譯是:

Swim up and learn about it .

沒有更新 NMT 前的離線翻譯是:

Swimming fitness, look.

更新 NMT 後的離線翻譯是:

Swimming fitness and understands.

這一回合,聯網時的翻譯罕見地出現了較大的偏差。在網頁版 Google 翻譯上還原的時候,只有第二種情況,沒有更新 NMT 的離線翻譯能夠準確還原。

總結

總而言之,Google 翻譯作為一種工具,為我們平常的生活、學習提供了很大的便利。離線情況下,就算加入了 NMT,解決了逐字翻譯的問題,用句子的方式來表達,但依然距離信達雅還有一定的距離。

聯網的 Google 翻譯,準確度依然是比較高的。還有就是,我們依然需要努力學習英文,不能太過依賴機器的翻譯,因為它們依然還沒有到達非常可靠的程度。

AlphaGo 神經網絡早在兩年前開始應用於 Google 翻譯,人工智能對人類語言識別依然在快速發展。對於目前手機的性能而言,將人工智能裝進移動設備,無論是硬件還是軟件,挑戰還是蠻大的。

這次 Google 將深度學習的模型壓縮到了普通智能手機可以承受的範圍內,我們這次發現,每種語言的離線壓縮包,大小都在 40-50 MB 左右。


分享到:


相關文章: