機器翻譯、詞典與英語學習

在寫這篇短文之前,我有這樣幾個基本的觀點:

1) 無論當下的機器翻譯質量與人的譯文相比孰優孰劣,機器翻譯從本質上都能幫助我們瞭解母語之外的其他語言文字,以及語言文字上承載的文化大, 但無法完全傳遞。

2) 機器翻譯也許會替代一部分人工翻譯,但不能因為機器翻譯的發展而停止語言學習,因為機器翻譯尚不能嵌入在我們的大腦中,我們必須要通過長時間刻苦學習才能掌握一門語言。

3) 機器翻譯能夠幫助我們更好得學習語言,但也可能會影響我們的語言學習質量。

4) 要想真正掌握一門語言,必須要查詞典,瞭解文字背後更為豐富的知識內涵。

5) 來自機器翻譯和大規模語料庫中的“真實文本”不一定真實和正確。

基於此,我談一下對“機器翻譯、詞典與英語學習”相結合的一些遐想。

劃詞翻譯

我自己一直致力於將計算機技術與翻譯結合到一起,所以平時特別關注與之相關的應用。

2007年我讀大學的時候,靈格斯詞典、金山詞霸風靡高校。

机器翻译、词典与英语学习
机器翻译、词典与英语学习

現在我偶爾會在給學生指導問題的時候看到他們電腦上還安裝著有道詞典,鼠標一劃就蹦出來單詞的解釋,既有很大的幫助,但有時也很煩人。

机器翻译、词典与英语学习

以前,我自己其實也用劃詞翻譯,但我用的是一個特別小眾的谷歌翻譯劃詞插件:

机器翻译、词典与英语学习

這個插件的作者叫“超級小雞”,插件的名字叫“Google 劃詞翻譯”,在谷歌瀏覽器的網上應用商店可以下載到。功能不多,但挺實用:

机器翻译、词典与英语学习

後來等我自己會開發程序的時候我發現一個很嚴重的問題,用戶每次在我的網站上查詢的內容其實我都可以寫幾行代碼把他們記錄下來存在我的數據庫中,我在劃詞時可並不都是要去查詢單詞的意思,有的時候可能就是單純的去複製我的個人信息,像劃詞翻譯這樣的功能豈不是有能力把我們每天劃詞的結果都送到它的服務器上存儲著?

由於我不知道“超級小雞”是誰,我也不知道這些詞典背後盯著用戶行為去研究產品功能的開發者是誰,所以我還是最終放棄了使用上面這些劃詞翻譯工具。

不過這個只是今天這篇文章的小插曲,我更多得還是想談談這種劃詞翻譯的方式是否有利於我們學習英語。

查詞典還是查機器翻譯

我思來想去,覺得劃詞翻譯給我帶來的短暫快感卻反而束縛了我對語言學習的興趣。

我最近自己開發了一個學生交翻譯作業的小工具,類似於之前我在微信文章中介紹過的吾譯超群平臺和試譯寶平臺,我也希望能夠看到一句話對應的多個學生的譯文,所以我大概花了一週的時間做了下面這個功能:

机器翻译、词典与英语学习

我稱之為“排排坐模式”。在看到同學們譯文的時候,我其實還會將他們的譯文放到ParaTrans裡面去對比他們的譯文與機器翻譯結果的相似度,讓我吃驚的是,我竟然找到了和機器翻譯一模一樣的譯文:

机器翻译、词典与英语学习

http://translation.education/paratrans/

譯文與機器翻譯相同其實並不可怕,因為機器翻譯也不是一無是處,可怕的是學生看到上面幾個機器翻譯都將“racing games”譯為“賽車遊戲”後,已經不再去查背景資料確認其正確的譯法。

有的時候我們在翻譯時遇到的文本內容都比較前沿,難免會有很新的內容,機器翻譯的訓練數據庫中可能並不包含這些數據,但是他們可能認為全部的待譯文本都是可譯的,所以無論如何都會給出一個譯文,哪怕原文是無意義的,比如下面這句話:

机器翻译、词典与英语学习

原句是我某一次在鍵盤上按著“D”和“F”鍵隨便輸入的一句話:

大幅度發的發的大福袋

機器翻譯竟然能給出非常有意思的譯文。

感覺以後可能會出現越來越多“rubbish in, rabbit out”的情況。

這些例子讓我意識到,今天的許多語言學習者會因為機器翻譯過於方便而不願意去花時間查詞典。

不懂還是得查詞典,還得是好詞典

有時候我會告訴他們我的習慣:

如果一個英文單詞我不懂,我傾向於先去查牛津詞典的英文解釋:

https://en.oxforddictionaries.com/

机器翻译、词典与英语学习

比如我最近正在寫一篇與“sine”(正弦)相關的文章,因為搞不定為什麼“sine”會翻譯成“正弦”,所以我去查了這個詞在牛津詞典英文版中的解釋:

机器翻译、词典与英语学习

於是我又去搜狗翻譯中去查看牛津雙語詞典的解釋(因為據說搜狗翻譯中的牛津雙語詞典是最新版的):

机器翻译、词典与英语学习

我在這個詞的查詢中發現了一些蹊蹺,比如為什麼這個詞源自拉丁語的“sinus”,而阿拉伯語譯成拉丁語時會變成“pocket”,於是我發現了一個這個詞在翻譯過程中出現的超級有意思的誤譯。

我會在另外一篇文章中詳細介紹我的有趣發現。

藉助這個例子,我想傳遞給大家一個信息,來自機器翻譯和大規模語料庫中的“真實文本”不一定真實和正確,學語言的同學還是應該去好好學習語言,有很多很多事情是機器做不到的。

正所謂:

語言學習路漫漫,誤信機翻淚不斷。


分享到:


相關文章: