AI 如何從令人失望到大行其道?

人工智能(AI)問世之初曾經狂妄自大、令人失望,它如何突然變成當今最熱門的技術領域?

這個詞語首次出現在1956年的一份研究計劃書中。

該計劃書寫道:“只要精心挑選一群科學家,讓他們一起研究一個夏天,就可以取得重大進展,使機器能夠解決目前只有人類才能解決的那些問題。”

至少可以說,這種看法過於樂觀。

儘管偶有進步,但AI在人們心目中成為了言過其實的代名詞,以至於研究人員基本上避免使用這個詞語,寧願用“專家系統”或者“神經網絡”代替。

“AI”的平反和當前的熱潮可追溯到2012年的ImageNet Challenge在線競賽。

AI 如何從令人失望到大行其道?


ImageNet是一個在線數據庫,包含數百萬張圖片,全部由人工標記。每年一度的ImageNet Challenge競賽旨在鼓勵該領域的研究人員比拼和衡量他們在計算機自動識別和標記圖像方面的進展。

他們的系統首先使用一組被正確標記的圖像進行訓練,然後接受挑戰,標記之前從未見過的測試圖像。在隨後的研討會上,獲勝者分享和討論他們的技術。

AI 如何從令人失望到大行其道?


傑夫裡·辛頓(Geoffery Hinton)

2010年,獲勝的那個系統標記圖像的準確率為72%(人類平均為95%)。2012年,多倫多大學教授傑夫·辛頓(Geoffery Hinton)領導的一支團隊憑藉一項名為“深度學習”的新技術大幅提高了準確率,達到85%。後來在2015年的ImageNet Challenge競賽中,這項技術使準確率進一步提升至96%,首次超越人類。

2012年的比賽結果被恰如其分地視為一次突破,但蒙特利爾大學計算機科學家約書亞·本吉奧(Yoshua Bengio)說,這依賴於“將之前已有的技術結合起來”。

AI 如何從令人失望到大行其道?


約書亞·本吉奧(Yoshua Bengio)

本吉奧和辛頓等人被視為深度學習的先驅。

從本質上來講,這項技術通過強大的計算能力和大量的訓練數據,復興了AI問世之初的一箇舊想法,也就是所謂的人工神經網絡(ANN),其靈感來自於大腦神經元網絡。

在生物大腦中,每個神經元被其他神經元發來的信號觸發,其自身發出的信號又會觸發其他神經元。一個簡單的ANN包含一個向網絡輸入數據的神經元輸入層,和一個輸出結果的輸出層,也許還有兩三個處理信息的中間隱藏層(實際上,ANN完全由軟件模擬而成)。

網絡中的每個神經元都有一組“權值”和一個控制其輸出啟動的“激活功能”。神經網絡的訓練涉及到調整神經元的權值,使特定的輸入產生我們需要的輸出。上世紀90年代初,ANN開始取得某些有用的結果,比如識別手寫數字。但如果讓它們去做更加複雜的任務,就會遇到麻煩。

AI 如何從令人失望到大行其道?


AI 如何從令人失望到大行其道?


在過去十年裡,新技術和對激活功能的一個簡單調整使訓練深度網絡成為可能。同時,互聯網的崛起使無數的文檔、圖片和視頻可用於訓練目的。這一切都需要強大的數據處理能力。

2009年前後,幾支AI研究團隊意識到,專門用來在PC和遊戲機上產生精細圖像的圖形處理單元(GPU)能夠提供強大的數據處理能力,也非常適合運行深度學習算法。

斯坦福大學的一支AI研究團隊發現,GPU可以使其深度學習系統的運行速度加快近百倍。該團隊由吳恩達領導,他後來又曾加入谷歌和百度。

AI 如何從令人失望到大行其道?


吳恩達

突然之間,訓練一個四層神經網絡只需要不到一天的時間,而以前需要好幾周。GPU製造商英偉達(NVIDIA)的老闆黃仁勳說,用來為玩家創造虛擬世界的芯片,也能用來幫助計算機通過深度學習技術理解現實世界。

ImageNet Challenge的比賽結果證明深度學習大有可為。突然之間,人們開始給予關注,不只是在AI圈子裡,還有整個技術界。此後,深度學習系統變得越來越強大:深度達到20或30層的網絡不再罕見,微軟(Microsoft)的研究人員甚至打造了一個152層的網絡。層數更多的網絡具有更強的抽象能力,能夠產生更好的結果。事實證明,這些網絡善於解決非常廣泛的問題。

“人們之所以關注這個領域,是因為深度學習技術具有廣泛的用途,”谷歌機器智能研究主管、負責谷歌搜索引擎的約翰·詹南德雷亞(John Giannandrea)說。

谷歌正在利用深度學習來提高其網絡搜索結果的質量,理解用戶向智能手機發出的語音命令,幫助人們搜索包含特定影像的照片,自動生成電子郵件智能回覆,改善網頁翻譯服務,幫助自動駕駛汽車識別周圍環境。

學習如何學習

深度學習分很多種,其中使用最廣泛的一種是“監督學習”,該技術利用標記樣本來訓練系統。

例如,就垃圾郵件過濾而言,這項技術可能會建立一個龐大的樣本信息數據庫,每條樣本信息被標記為“垃圾郵件”或者“非垃圾郵件”。深度學習系統可以使用這種數據庫進行訓練,通過反覆研究樣本和調整神經網絡內部的權值,改善垃圾郵件的識別準確率。

這種方法的優點在於,不需要人類專家制定一套規則,也不需要程序員編寫代碼執行規則。系統能夠直接從標記數據中學習。

使用標記數據進行訓練的系統被用來分類圖像,識別語音,發現信用卡欺詐交易,識別垃圾郵件和惡意軟件,定向投放廣告。對於這些應用,正確的答案已經存在於先前的大量樣本中。

當你上傳照片時,Facebook可以識別和標記你的朋友和家人。近期,該公司發佈了一個系統,可以為失明用戶描述照片的內容(“兩個人,笑,太陽鏡,戶外,水”)。

吳恩達說,監督學習能夠用於各種各樣的數據。通過採用這項技術,現有的金融服務、計算機安全和營銷公司可以貼上AI公司的新標籤。

另一種技術是非監督學習,同樣是使用大量樣本來訓練系統,但這些樣本沒有經過標記。系統學習識別特徵和聚類相似樣本,發現數據中隱藏的集合、聯繫或模式。

AI 如何從令人失望到大行其道?


非監督學習可以用來搜尋沒有具體形象的東西,比如監督網絡流量模式,探測可能與網絡攻擊有關的異常現象,或者檢查大量的保險索賠,揭露新的欺詐手法。

再舉一個著名的例子。

2011年在谷歌工作時,吳恩達領導了一個名為Google Brain的項目,要求一個龐大的無監督學習系統尋找數千個非標記YouTube視頻中的共有圖案。

一天,吳恩達的一位博士生給他帶來了一個驚喜。“我記得他把我叫到他的電腦前,對我說‘瞧這個,’”吳恩達回憶道,屏幕上有一張毛茸茸的臉,那是從數千個樣本中提取的圖案。系統發現了貓。

強化學習介於監督和非監督學習之間,只使用偶爾的獎勵反饋來訓練神經網絡與環境互動。

從本質上講,訓練涉及到調整網絡的權值,尋找一個持續產生更高獎勵的策略。DeepMind是這方面的行家。

2015年2月,該公司在《自然》(Nature)雜誌上發表了一篇文章,描述了一種強化學習系統,它能夠學會玩49款雅達利經典電子遊戲,只使用屏幕像素和遊戲得分作為輸入數據,其輸出數據與虛擬控制器連接。該系統從頭開始學習翫這些遊戲,在29款遊戲中都達到或超過了人類的水平。

讓系統玩遊戲

DeepMind的德米斯·哈薩比斯(Demis Hassabis)說,對AI研究而言,電子遊戲是理想的訓練場,因為“它們就像現實世界的縮影,但更加明晰,更有約束”。

AI 如何從令人失望到大行其道?


德米斯·哈薩比斯(Demis Hassabis)

遊戲引擎也能非常輕鬆地產生大量的訓練數據。

哈薩比斯曾從事電子遊戲行業,後來獲得認知神經科學博士學位並創建DeepMind。這家公司現在是谷歌旗下的AI研究部門,辦公地點位於倫敦國王十字車站附近。

2016年3月,DeepMind研發的AlphaGo系統擊敗了圍棋頂尖高手李世石,在五局比賽中取得4:1的壓倒性勝利。

AlphaGo是強化學習系統,具有某些不同尋常的特徵。它由幾個相互連接的模塊組成,包括兩個深度神經網絡,分別擅長不同的領域,就像人腦的左右半球。

其中一個網絡接受的訓練是分析數百萬盤圍棋棋局,從而在實戰中給出贏面最高的幾種下一步落子選擇,然後交由另一個網絡進行評估,後者採用隨機取樣的技術。因此,AlphaGo同時結合了仿生技術和非仿生技術。

關於哪種方法更好的問題,AI研究人員爭論了幾十年,但AlphaGo雙管齊下。

“這是個混合系統,因為我們相信,我們將不止需要深度學習來解決智力問題,”哈薩比斯說。

哈薩比斯和其他研究人員已經在著手下一步,也就是遷移學習。這可以使強化學習系統把先前已獲得的知識作為基礎,而不必每次都從頭訓練。

哈薩比斯指出,人類可以毫不費力地做到這一點。詹南德雷亞回憶說,他四歲的女兒知道大小輪腳踏車也是一種自行車,即使她以前從未見過。“計算機做不到這一點,”他說。

被Salesforce收購的AI初創公司MetaMind致力於另一種相關的方法,名為多任務學習,也就是同一個神經網絡架構被用來解決幾種不同的問題,解決其中一種問題的經驗使它能夠更好地解決另一種問題。

和DeepMind一樣,MetaMind也在探索模塊化架構,其中一種架構名為“動態記憶網絡”,能夠獲取一系列陳述,然後回答有關這些陳述的問題,推斷出它們之間的邏輯聯繫(Kermit是青蛙,青蛙是綠色的,所以Kermit是綠色的)。

MetaMind還把自然語言和圖像識別網絡整合進同一個系統,能夠回答有關圖像的問題(“這輛車是什麼顏色的?”)。其技術可以用於面向Salesforce客戶的自動化客戶服務機器人或者呼叫中心。

以前,原本形勢大好的AI新技術往往會迅速失勢。但深度學習不同。

“它確實很有用,”MetaMind的理查德·索赫爾(Richard Socher)說。人們每天都在使用它,但並沒有意識到它的存在。

AI 如何從令人失望到大行其道?


理查德·索赫爾(Richard Socher)

哈薩比斯和索赫爾等人的長期目標是打造“通用人工智能”(AGI),也就是能夠處理多種任務的系統,而不是為每個問題都單獨創造一個新的AI系統。

索赫爾說,AI研究多年來聚焦於解決具體狹隘的問題,但現在研究人員正在“以新的方式拼湊更先進的樂高積木”。

哪怕是最樂觀的人也認為,還得再需要十年才能實現具備人類水平的AGI。但哈薩比斯說:“我們覺得,我們知道實現AGI需要哪些關鍵的東西。”

AI已經在發揮實際作用,並且將很快變得越來越有用。

谷歌的Smart Reply系統(利用兩個神經網絡自動生成電子郵件回覆)在短短四個月的時間內,就從深度學習研究項目變成了現實產品(不過剛開始的時候不得不阻止它對幾乎每封郵件都生成“我愛你”的回覆)。

“你在學術期刊上發表論文,毫不誇張地說,隨後的一個月就會有公司使用那個系統,”索赫爾說。

來自大大小小的AI公司的學術論文持續不斷。AI研究人員被允許在同行評審期刊上發表他們的研究結果,即使是在轉化投產之後也可以。他們中的很多人一邊為企業工作,一邊發表學術文章。

“如果你不讓他們發表,他們就不會為你工作,”安德森-霍洛維茨基金(Andreessen Horowitz)的克里斯·迪克森(Chris Dixon)說。

谷歌、Facebook、微軟、IBM、亞馬遜、百度和其他公司提供了免費的開源深度學習軟件。一個原因是這些公司的研究人員希望公佈他們正在做的事情,這有助於招募人才。

另一個原因在於,大型互聯網公司能夠承擔免費提供AI軟件的後果,因為他們可以從其他地方獲得巨大好處:獲取大量用戶數據用於訓練目的。

投資基金Bloomberg Beta的席翁·齊利斯(Shivon Zilis)說,這使他們在某些領域具有優勢。而初創公司則想辦法進入特定市場。例如,無人機初創公司利用模擬數據來了解如何在擁擠環境中飛行。

創業孵化器Y Combinator總裁薩姆·阿爾特曼(Sam Altman)說,在互聯網上能夠找到很多訓練數據。他指出,人類可以從不算多的數據中學習,“這說明沒有大量的訓練數據也可能產生智慧”。致力於使用較少數據來訓練AI的初創公司包括Numenta和Geometric Intelligence。

選取和組合

各公司爭先恐後地為AI淘金熱的參與者們提供鏟子。迪克森說,其中最頻繁出現的一個名字是英偉達。

每家AI初創公司似乎都在使用英偉達的GPU芯片來訓練神經網絡。也可以通過亞馬遜和微軟的雲服務租借GPU容量。

同時,IBM和谷歌專門設計了新的芯片,使AI軟件運行更快、更有效。

谷歌、微軟和IBM提供了免費的語音識別、句子分析和圖像分析等在線AI服務,使初創公司可以用這些積木搭建出新的AI產品和服務。

AI 如何從令人失望到大行其道?


古魯達斯·巴納瓦爾(Guruduth Banavar)

IBM的古魯達斯·巴納瓦爾(Guruduth Banavar)說,來自各行各業的超過300家公司已經使用IBM的Watson平臺打造AI驅動的應用程序,涵蓋從篩選求職者到挑選葡萄酒的方方面面。

對大多數人來說,AI的這些進步將會表現為他們每天使用的互聯網服務的逐漸改進。搜索引擎將顯示更加相關的搜索結果,推薦將更加準確。

哈薩比斯預測,幾年之內,一切都將嵌入某種程度的智能。AI技術將使電腦界面具備會話和預判功能,而不只是由菜單和圖標驅動。本吉奧說,與電腦對話將方便那些無法讀寫和目前不會上網的人使用電腦。

但到了某個時候,逐漸改進將導致質變,使機器能夠完成之前只有人類才能完成的任務。

自動駕駛汽車正迅速變得越來越好,不久後也許就能取代出租車司機,至少在市區這樣的受控環境中。陸空兩用送貨無人機可以與人類送貨員相媲美。更強大的視覺系統和機器人技術使機器人可以往超市貨架上擺放商品,在倉庫裡搬運物品。迪克森說,有很大的機會實現意料之外的突破。

有人擔心,AI技術將大大加快某些任務的計算化和自動化,就像200年前蒸汽動力和新機器使很多工人失業一樣。

“蒸汽加快了已經在進行的一個過程,但這個速度太快了,令人感到恐懼,”英國詩人羅伯特·騷塞(Robert Southey)說。他擔心,“這種強大動力的發現”令我們措手不及,“不知道如何正確地使用它”。

現在,很多人也這樣看待人工智能。

(翻譯 | 于波,校對 | 其奇,編輯 | 漫倩


分享到:


相關文章: