如果德語是條形碼,漢字是二維碼!碾壓即將開始!

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

曾幾何時,中國人心裡有這樣一種成見:認為漢語遲早要被拉丁語言所淘汰。很多人也認為,全球化的結果就是讓英語統治世界。但是最近的一則報道卻讓大家眼前一亮!

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

英國政府已將漢語納入國民教育體系,並提出2020年漢語學習人數要達到40萬。請點擊此處輸入圖片描述

最近大嬸搞了一臺錘子手機,拋棄其他的不講,光是閃念膠囊就值得入手。無論什麼時候你有想法,直接就可以語音輸入,系統自動將語音轉換成文字並記錄下來。據說它採用的科大訊飛技術,語音識別率已經高達97%,這也意味著,如果不是非要咬文嚼字的話,漢字已經幾乎可以脫離鍵盤了。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

這讓大叔突然有了一種“山中才數日,人間已千年”的感覺,在智能化的時代,差點拼音化的漢語優勢逐漸顯露,讓人不禁感慨風水輪流轉,三十年河東,三十年河西。

悠久的歷史

中文的歷史可以追溯到五千年前,而現代德語的發展也就是500年左右的時間,從1578年的拉丁語版的《德語正字法》(De orthographia Germanica)到1663年的《德意志普通語詳論》(Ausführliche Arbeit von der Teutschen Haubt Sprache),一直到到19世紀現代德語的標準音才形成,1880年康拉德·杜登(Konrad Duden)出版了德語的第一本全正體書寫詞典,1901年經過小的更改後這部詞典成為標準德語的唯一的規則作品。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

對於德國人來說,要讀懂幾百年前的書籍卻是困難重重。大叔到找了一段中古德語和現代德語對比的小詩,不知道大家能看懂多少:

中古德語:Dû bist mîn, ih bin dîn:des solt dû gewis sîn.dû bist beslozzen,in mînem herzen,verlorn ist daz sluzzelîn:dû muost och immer darinne sîn.

現代德語:Du bist mein, ich bin dein,dessen sollst du sicher sein,Du bist verschlossen,in meinem Herzenverloren ist der Schlüssel fein,Du musst für immer darinnen sein

而對於我們來說,即便是小學生,也可以朗朗誦讀2000年前的詩詞歌賦,理解也毫無問題。哪怕因為歷史久遠,幅員遼闊,中文的語音有千差萬別,但只要寫成文字,都不影響人們的溝通和理解。正是因為漢字的超穩定性,使得中華文明五千年來一直綿延不絕。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

正如餘秋雨所說:“漢字是第一項中華文明長壽的秘密,它是活著的圖騰,永恆的星辰”。

更少的詞彙量

據說,在中國掃盲的標準是1500個字。理工科的大學生,一般只要掌握3500漢字,搞科研沒問題。普通人掌握了2000個漢字,讀書寫字都沒有問題。大叔的侄兒在國內幼兒園從來沒有學過認字,一年級讀完以後,隨便拿起一份報紙,基本可以直接念出來,意思也能理解七八成;二年級學校就要求300字左右的作文,這只是國內普通學校的要求。

據說在英語國家,沒有20000個字別想讀報,沒有30000字別想讀《時代》週刊。大學畢業10年的職業人士一般要懂80000字。在莎士比亞時代,英語僅有三萬個單詞,他本人能夠全部掌握。但是,到了丘吉爾時代,他的單詞量依然是三萬個,可是,那個時候的英語已經擁有近百萬個單詞了。這個時候,詞彙量就成為人與人之間不可逾越的鴻溝

德語的詞彙雖然沒有英語那麼多,但是總的詞彙量也有幾十萬。進入德國大學,沒有萬八千單詞儲備基本上就是聽天書。以前德語大量都是類似中文的組合詞結構,但最近現代德語中大量引入了其他語言,特別是從英語引入的網絡詞彙,造成了德語詞彙的大爆炸。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

想想看,歐美語系的人掌握了幾萬詞彙,他能享受的信息還很有限,每年還要面對上萬新詞。中國人只要三四千漢字,就可享受幾乎全部信息。

德國的萊布尼茲認為,漢語是自亞里士多得以來,西方世界夢寐以求的組義語言。但是,他對漢字的瞭解還不夠深入,僅僅因為漢字數量上的性能而定義漢字是世界上最先進的文字。

不斷進步的漢字

在老外的想象中,中文鍵盤應該是長這個樣子:一個圓形的大鍵盤,上面佈滿了常用漢字,需要使用哪一個字就按下對應的按鍵。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

但事實上漢字辣麼多,一個鍵盤肯定是不夠,中國人工作的畫面大概是這樣的:

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

人們站在電腦面前,手執棍子,對著鍵盤動次打次的敲出一行行文字,彷彿鼓手一樣帥氣,偶爾還用踩踩踏板切換,那畫面真是美不勝收。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

記得大叔小時候時候,很多人都說:“走拼音化道路是漢語的必然趨勢。”其中最主要的一條理由便是,英文可以打字,而漢語不能。但這個事情最終沒有發生,你也沒有用打架子鼓的方法打字,這個你不得不感謝一個人——王永民。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

他發明的五筆輸入法,直接實現了漢字與26個按鍵的“無縫連接”,每個字最多隻需四碼便能完成輸入。而且重碼率低,幾乎不需要選詞,直接就可以實現盲打。這個方案,直接堵住了那些說要廢了方塊字,將“漢字拼音化”的人的嘴巴。

如果德語是條形碼,漢字是二維碼!碾壓即將開始!

隨著計算機技手術的發展,漢字的鍵盤輸入速度已遠遠超過英文,而且還在隨著技術手段的進步而不斷快速提高。可英文呢?一直滯步不前吧?!

獨特的優勢

鍵盤輸入再快也快不過說話,隨著智能設備的普及,簡單的文字輸入顯然已經不能滿足人們的需求。那麼在語音輸入時代,中文又有什麼獨特的優勢呢?

漢語普通話有20個聲母39個韻母和4個聲調,連乘的結果大約是3000個聲音。能被利用的是2500個聲音,常用的是1200個聲音。也就是說,漢語普通話想表達1200個事物,只需1個聲音。

德語語有5個基本元音,3個變元音,5個複合元音,22個輔音,沒有聲調,所以,德語的聲音種類不會超過13×22=286個。也就是說,如果一個聲音對應一個事物,那麼,德語的286個聲音只能表達286個事物。這286個事物之外的事物,如果要表達,就只能靠聲音的重複才行,用2個或2個以上聲音表達。可見,德國人要表達第287種事物,就需2個聲音。

對於計算機而言,中文的單音節很容易可以直接識別,而多音節構成的語言就必須要經過複雜的分離組合運算。誰快誰慢顯而易見。

再舉個例子,同樣是背乘法口訣,中國小孩“一一得一,一二得二,一三得三......." 背到九九八十一,德國小朋友“Eins mal eins ist eins, eins mal zwei ist zwei,eins mal drei ist drei .....” 同樣的時間,德國孩子最多背到七七四十九。

漢字的這種大量單音節結構,不僅讓語言更加簡潔,還有一個隱藏的的好處,你的思維速度遠超歪果仁!我們知道,思維實際上是一種心裡說的過程,如果在說話時表達得快,那麼,思維的速度一定會更快。

更高的效率

漢字的優勢,還體現在它的排列上。漢字可以從左到右排列,從右到左排列,從上到下排列,當然如果你喜歡,從下到上也是可以的。

什麼意思?也就是說,漢字的序順並不定一能影閱響讀,比如當你看完這句話後,才發這現裡的字全是都亂的。。。

從人工智能的角度來講,這就是最基本的貝葉斯理論。雖然你可能意識不到,但是人類時時刻刻都在用它做出判斷。

百度百科的解釋:“貝葉斯決策就是在不完全情報下,對部分未知的狀態用主觀概率估計,然後用貝葉斯公式對發生概率進行修正,最後再利用期望值和修正概率做出最優決策。”

再舉個例子:“床前月明光,疑是上地霜。

當我們看見“床前”二字之後,再瞄一眼後面的內容(只要是學過的人很少會再一字一字去看的,所以是瞄),基本上就調出以前的知識儲備。大腦裡反應的就是“床前明月光,疑是地上霜”。這也是大腦節省認知資源的一種機制。

這種機制有點像二維碼的抗損壞機制,只要mark點存在,被破壞的信息很大程度上就可以恢復。

歐美語言是一維的,是密碼語言。書寫是編碼,讀取是解碼。我們可以這樣設想:如把德語的a、b、c、d、e換成1、2、3、4、5,並沒有什麼原則上的區別。按上邊的對應,如一開始就把dom寫成312沒有什麼原則上的區別。用什麼樣的讀音都沒有關係。

漢語就完全不同了,它是二維的,最大限度地利用了上下左右的幾何空間。每個漢字就是一幅畫。試問給你看一副畫容易記住,還是看一串密碼容易記住?

每個漢語都蘊含了大量的二維信息,高效而生動;拉丁文字只有一維密碼信息,低效而枯燥。記得有調查顯示,在聯合國5種文字的官方文件中,最薄一本一定是漢語。如今漢語的精確性已為蓬勃發展的中國科技事業所證實;漢語的輸入已經超過拉丁語言;漢字的語音輸入已經具備實用性....

或許我們能看到一個大漢語時代的到來!


分享到:


相關文章: