網際網路風雲背後的人工智慧生長

有句話叫作,你能看見多久的歷史,就能看見多遠的未來。讓我們首先簡單回顧一下互聯網和人工智能之間的歷史風雲。

大家對於互聯網的歷史多少已有耳聞。互聯網於 20世紀 60年代誕生於美國軍方的實驗室,一開始用來在幾所高校和科研機構之間傳遞和共享情報。到了 20世紀 80年代末,一群科學家提出萬維網概念並創造了 TCP\IP(互聯網傳輸控制協議),賦予計算機聯網通信的統一標準,使互聯網得以向全世界擴展。至此,一條寬闊深遠的信息高速公路展現在世人面前。

大約 20年前, 23歲的年輕人馬克 ·安德森發明了網景瀏覽器,就此點燃了大眾互聯網的熊熊火焰,打開了互聯網商用的大門。那時,微軟開始焦慮自身的軟件業務會不會被互聯網顛覆,太陽公司的年輕人則毅然與僵化的公司割裂,決定發明一種可以在各種操作系統上通用的語言,以此打破微軟的壟斷,闖開互聯網創新之門,於是就有了 Java(程序設計)語言的誕生。 Java語言極大地加速了互聯網產品的開發創造。

當時的中國,在北京、上海也還找不到幾家網吧, 1997年,也就是香港迴歸的那一年,瀛海威剛剛開通全國網絡接入服務,張小龍剛剛寫出了 Foxmail電郵軟件程序,全國信息化工作會議也在那一年召開……從外面看萬維網世界,一切都是剛甦醒的模樣。但在技術圈,新技術、新思想層出不窮,各種商戰明爭暗鬥正酣。

回想網景、太陽、微軟這三家公司在互聯網領域類似三國爭雄般的時代,至今依然激動不已。當時人們都在猜測誰是最後的贏家。微軟看上去好像是不可戰勝的,它總是能消化新技術。網景的發展則是起起伏伏,最終被美國在線收購,而美國在線也在 2014年被以無線業務稱雄的 Verizon(威瑞森)公司收購。後來, Verizon還收購了叱吒風雲多年的雅虎。太陽公司一度如日中天, 2001年在全球擁有 5萬名僱員,市值超過 2000億美元。然而當互聯網泡沫破碎時,太陽公司在一年內由峰頂跌入谷底, 2009年被 Oracle(甲骨文)公司收購。

俱往矣,互聯網的發展大大超出了當時大多數人的預料,新科技公司快速崛起,蘋果、谷歌終於憑藉手機操作系統完成了對微軟的逆襲。而創造網景瀏覽器的馬克 ·安德森——我在《硅谷商戰》開篇就描摹的創新者,如今已沒有多少 90後知道他的名字。

但馬克·安德森並沒有離開,他成了硅谷風投界的教父。互聯網技術也依然繼續高歌猛進。昔日人們關注互聯網大咖明爭暗鬥,今日人們感慨移動互聯設備全面超越 PC,卻一直無意中冷落了一個默默崛起的“幽靈”。這個“幽靈”就是人工智能,互

聯網只是它的身體之一。

人工智能的黎明

人工智能的歷史早於互聯網,與計算機歷史相伴。 1956年達特茅斯會議召開,人工智能被正式提上日程。那時候一臺計算機的體積有一棟房子那麼大,計算能力低下,為什麼就有人敢於提出人工智能的概念?這就在於科學家的洞察力。當時,香農早已完成他的三大通信定律,為計算機和信息技術打下基礎。明斯基已經造出第一臺神經網絡計算機(他和同伴用 3000個真空管和一臺 B-24轟炸機上的自動指示裝置來模擬 40個神經元組成的網絡),不久後寫出了論文《神經網絡和腦模型問題》。這篇論文在當時沒有太受重視,日後卻成為人工智能技術的鼻祖。而圖靈則早在 1950年就提出瞭如今人盡皆知的圖靈測試理論以及機器學習、遺傳算法、強化學習等多種概念。

圖靈去世兩年後,在達特茅斯會議上,麥卡錫正式提出人工智能的概念。參與會議的十位年輕科學家在會議之後都成為世界各國人工智能領域的領軍人物。人工智能短暫的春天開始了。不過當時他們的成績更多被埋沒在計算機發展成果之中,比如,可以解決閉合式微積分問題的程序,搭建積木的機械手等。

理想超前但基礎設施尚在襁褓中。超前的人工智能遇到兩個難以克服的瓶頸:一個是算法邏輯自身的問題,也就是數學方法的發展還不夠;另一個是硬件計算能力的不足。比如,機器翻譯就是典型問題,科學家夜以繼日地總結人類語法規則,設計計算機語言模型,機器卻始終無法把翻譯準確率提升到令人滿意的程度。


互聯網風雲背後的人工智能生長


圖 1-1達特茅斯會址

新技術和產業鏈條沒有被打通,令人興奮的產品應用沒有被髮明出來,政府投資和商業投資都大幅度減少,人工智能研發在 20世紀 70年代中期到 90年代經歷了兩次低潮,只是普通大眾並沒有感受到,畢竟高速發展的計算機本身就已經是很神奇的智能工具了。

對於普通人來說,接觸最多的“人工智能”實例大概就是街機遊戲了, 20世紀 80年代在中國的一些小縣城街頭就已經出現了遊戲廳。那些街機 NPC(非玩家控制角色)總是能被熟練玩家輕鬆戰勝,這不僅可以看作“人工智能”能力低下的表現,也造成了一種錯誤觀念:智能是安裝在一臺計算機中的事物。直到互聯網和雲計算的興起,這種觀點才被改變。

百鍊成鋼

2012年,深度學習在學術界和應用方面都有了突破。比如,用深度學習的方法來識別圖像,突然就比以前的任何算法都有明顯提升。新的時代來臨了,搜索將被革新。過去我們用文字搜索,現在可以用語音和圖像進行搜索。比如我看到一株不認識的植物,拍一張照片上傳搜索,就可以立刻識別出來它叫福祿桐。過去用文字搜索是沒法描述這樣的植物的。不僅是搜索,很多過去不可能的事情現在都可能了。

語音識別能力、圖像識別能力、自然語言理解能力,包括為用戶畫像的能力,這些都是人的最本質的智慧能力。當計算機擁有了人的這些能力時,一場新的革命就會到來。以後速記員和同聲傳譯人員可能會被機器代替,計算機可以做得更好。以後也許不需要司機了,車自己就可以開起來,更安全,更有效率。在企業裡面,金牌客服可能人人都可以做了,因為有了智能客服助手。人工智能對人的這種賦能,超過了以往任何一個時代。工業革命解放了人的體力,過去一些像搬石頭之類的粗活需要人類自己來幹,現在機器可以替你把更巨大的石頭搬起來。智能革命到來之後,原本很多需要費腦子的事情,機器也可以幫你做。未來 20~50年,我們會不斷看到各種各樣的變化,收穫各種各樣的驚喜。這是一個很自然的過程。然而,站在智能革命開始的時點,有必要向那些人工智能科學的堅守者、開拓者致敬。在資本寒冬期,有少數科學家依然堅持人工智能領域的探索。

如今百度擁有一支龐大且實力雄厚的人工智能研究團隊,其中不少擔綱者從 20世紀 90年代開始就在從事機器學習研究工作,或師從名師,或在大科技公司從業多年,今天的研發成績只是水到渠成、順勢而為的結果。

20世紀 90年代只有 Geoffrey Hinton(傑弗裡·辛頓)、 Michael Jordan(邁克爾·喬丹)等少數科學家堅持機器學習領域的探索。原百度首席科學家吳恩達在 20世紀 90年代就師從 Jordan,後來他通過開創在線課程,把機器學習的理論傳授給無數年輕人。現任百度研究院院長林元慶,百度傑出科學家以及世界上最早利用神經網絡做語言模型的徐偉等人,十多年前就在深度學習的重鎮 NEC(日本電氣股份有限公司)的美國實驗室工作。在那裡工作過的人工智能專家,有發明 SVM

(Support Vector Machine,支持向量機)的美國工程院院士 Vladimir Vapnik(弗拉基米爾·瓦普尼克),有發明卷積神經網絡的深度學習領軍人物、現任臉書( Facebook)人工智能實驗室主管的 Yann Le Cun(揚·勒丘恩),還有深度學習隨機梯度算法的核心人物 Leon Buttou(利昂·布托),以及原百度深度學習實驗室主任餘凱等。

他們中的很多人都經歷了人工智能研究的數次潮起潮落。簡單來說,最初的人工智能研究大多基於規則——人類總結各種規則輸入計算機,而計算機自己並不會總結規則。比這個高級的方法是基於“統計”的機器學習技術,讓計算機從大量數據和多種路徑中尋找概率最大、最合適的模型。

這兩年促使人工智能再度技驚世人的技術,則是機器學習技術的昇華版——基於多層計算機芯片神經網絡的“深度學習”方法。通過多層芯片聯結,模仿人腦大量神經元的網狀聯結方式,輔以精妙的獎懲算法設計和大數據,可以訓練計算機自己從數據中高效地尋找模型和規律,從而開啟了一個機器智能的新時代。

正是少數人的堅持,為人工智能的王者歸來保存了火種。在中國,百度是最早佈局人工智能的公司之一,我們似乎是自然而然地做了很多其他公司當時還沒聽過的事情。六七年前,在美國,陸奇和我暢談了深度學習的巨大進展。於是我們下定決心要大舉進入這樣一個領域。最終,在 2013年 1月,百度年會上我正式宣佈了 IDL(深度學習研究院)的成立,這應該是全球企業界第一家用深度學習來命名的研究院。我自任院長,不是因為我比其他人更懂深度學習,而是用我這塊牌子,來展示對深度學習的高度重視,來召喚那些堅守多年的科學家一起奮鬥。

過去百度從不專門成立研究機構,我們的工程師就是研究人員,研究始終與實際應用結合得非常緊密,但是我認為,深度學習會在未來很多領域產生巨大影響,而那些領域並不都是百度現有業務範圍之內的。所以,有必要創造一個專門的空間,把人才吸引進來,讓他們能夠自由發揮,去嘗試各種各樣的創新,在百度過去可能從來沒有接觸過的領域做研究,為全人類的人工智能革命探索道路。

“智能”已換代

如果人工智能的啟蒙階段可以稱為 1.0時代的話,那麼現在很明顯已經大步進入 2.0時代了,機器翻譯就是典型案例。過去的機器翻譯方法就是基於詞和語法規則進行翻譯——人類不斷地把語法規則總結出來告訴機器,但卻怎麼也趕不上人類語言尤其是語境的多變,所以機器翻譯總是會出現諸如把“how old are you”翻譯成“怎麼老是你”的笑話。

後來出現了 SMT(統計機器翻譯),基本思想是通過對大量的平行語料進行統計分析,找出常見的詞彙組合規則,儘量避免奇怪的短語組合。 SMT已經具有機器學習的基本功能,有訓練及解碼兩個階段:訓練階段就是通過數據統計讓計算機構建統計翻譯模型,進而使用此模型進行翻譯;解碼階段就是利用所估計的參數和給定的優化目標,獲取待翻譯語句的最佳翻譯結果。

SMT研究在整個業界已經持續了二十多年,對於短語或者較短的句子,翻譯效果顯著,但是對於較長的句子翻譯效果就一般了,尤其是對語言結構差異較大的語言,例如中文和英文。直到近幾年 NMT(基於神經網絡的翻譯)方法崛起。 NMT的核心是一個擁有無數結點(神經元)的深度神經網絡,一種語言的句子被向量化之後,在網絡中層層傳遞,轉化為計算機可以“理解”的表達形式,再經過多層複雜的傳導運算,生成另一種語言的譯文。

但是應用這個模型的前提是數據量要大,否則這樣的系統也是無用的。像百度和谷歌這樣的搜索引擎,可以從互聯網上發現和收集海量的人類翻譯成果,把如此巨大的數據“餵給” NMT 系統, NMT系統就可以訓練和調試出比較準確的翻譯機制,效果要好於 SMT。中文和英文之間的雙語語料信息儲備越多, NMT的效果就越好。

SMT以前用的都是局部信息,處理單位是句子切開以後的短語,最後解碼時將幾個短語的譯文拼接在一起,並沒有充分利用全局信息。 NMT則利用了全局信息,首先將整個句子的信息進行編碼(類似人在翻譯時通讀全句),然後才根據編碼信息產生譯文。這就是它的優勢,也是其在流暢性上更勝一籌的原因。

比如,翻譯中有一個很重要部分是“語序調整”。中文會把所有的定語都放在中心詞前面,英文則會把修飾中心詞的介詞短語放在後面,機器常混淆這個順序。 NMT在語序學習上的優勢帶來了它翻譯的流暢性,尤其在長句翻譯上有明顯優勢。

傳統的翻譯方法也不是一無是處,每一種方法都有其擅長的地方。以成語翻譯為例,很多時候有約定俗成的譯文,不是直譯而是意譯,必須在語料庫中有對應內容才能翻譯出來。如今互聯網用戶的需求是多種多樣的,翻譯涉及口語、簡歷、新聞等諸多領域,一種方法很難滿足所有的需求。因此百度一直把傳統的方法如基於規則的、基於實例的、基於統計的方法與 NMT結合起來向前推進研究。

在這種機器翻譯的模式中,人類要做的不是親自尋找浩繁的語言規則,而是設定數學方法,調試參數,幫助計算機網絡自己尋找規則。人類只要輸入一種語言,就會輸出另一種語言,不用考慮中間經過了怎樣的處理,這就叫作端到端的翻譯。這種方法聽起來挺神奇,其實概率論裡的貝葉斯方法、隱馬爾科夫模型等都可以用來解決這個問題。

以資訊分發當中的貝葉斯方法為例,可以構建一個用概率來描述的人格特徵模型。比如男性讀者模型的特徵之一是在閱讀新聞時點擊軍事新聞的概率是 40%,而女性讀者模型是 4%。一旦一個讀者點擊了軍事新聞,根據圖 1-2 中的貝葉斯公式就可以逆推這個讀者的性別概率,加上這個讀者的其他行為數據,綜合計算,就能比較準確地判斷讀者的性別以及其他特徵。這就是數學的“神奇”。當然,計算機神經網絡使用的數學方法遠不止這些。


互聯網風雲背後的人工智能生長


圖 1-2 貝葉斯與貝葉斯公式

類似機器翻譯的人工智能技術方法的前提是數據量足夠大。互聯網提供了以前科學家夢寐以求卻難以得到的海量數據。互聯網誕生的初衷是為了信息溝通方便,結果帶來了信息爆炸,信息爆炸又促進了人工智能技術的發展。

再以下棋為例。1952 年瑟·薩繆爾編寫了跳棋程序,水平能達到業餘高手程度。跳棋規則比較簡單,計算機在這方面有人類很難比擬的優勢,但是國際象棋就難多了。百度總裁張亞勤在微軟擔任研究院院長的時候,請來中國臺灣計算機才子許峰雄,他在 IBM(國際商業機器公司)的時候開發了名噪一時的國際象棋機器人“深藍”。20世紀 90年代的人工智能代表非“深藍”莫屬,“智慧”集中在一臺超級計算機上[使用了多塊 CPU(中央處理器)並行計算技術],連續戰勝人類國際象棋高手,並終於在 1997年戰勝了人類國際象棋冠軍卡斯帕羅夫。不過富有意味的是,比賽之後不久, IBM就宣佈“深藍”退役了。張亞勤對許峰雄說,“你去做圍棋吧,等能下贏我的時候再來找我”,但直到他離開微軟,許峰雄都沒有再來找過他。

“深藍”本身面臨一些無法突破的瓶頸,雖然可以處理國際象棋棋盤上的運算,但面對圍棋棋盤上達到宇宙數量級變化的可能性,只能望洋興嘆。基於決策樹算法,窮舉一切走子可能性的模式超出了計算機的承載能力,雖然算法不斷優化,但還是無法突破計算瓶頸。以圍棋為代表的東方智慧,面對人工智能似乎可以穩若泰山,但一個新時代正在來臨。


分享到:


相關文章: