05.29 AI 革命尚未到來!

作者:Michael I. Jordan是加州大學伯克利分校電氣工程和計算機科學系和統計系的教授

AI 革命尚未到來!

AI是當下這個時代的口號。這是技術人員、學者、記者和風險投資家都掛在嘴邊的術語。與許多從技術學術領域跨越到公眾領域的術語一樣,這個術語的使用存在嚴重的誤解。但這不是公眾不瞭解科學家的典型情況――科學家常常與公眾一樣迷惑不解。我們這個時代在某種程度上看到芯片擁有與我們人類媲美的智能,這個想法讓我們所有人饒有興趣,我們既興奮又害怕。而遺憾的是,這讓我們分心了。

對於當下這個時代,有一種不同的描述。不妨聽聽下面這個故事,關於人類、計算機、數據和生死的故事,故事的重點是芯片智能這類幻想之外的東西。

14 年前我妻子懷孕時,我們做了超聲檢查。房間裡有一位遺傳學家,她指出胎兒心臟周圍有幾個白點。她指出:“這是唐氏綜合症的標誌,你的風險現已上升到了1/20。”她進一步告訴我們,可以做個羊膜穿刺,確定胎兒是否存在導致唐氏綜合症的基因轉變。但是羊膜穿刺有風險,穿刺過程中胎兒致死率約1/300。身為統計學家,我決定搞清楚這些數字來自哪裡。長話短說,我發現十年前已在英國進行過一項統計分析,表明鈣沉積的這些白點確實是表明唐氏綜合症的指標。但我也注意到,檢查中使用的那臺影像儀器每平方英寸的像素比英國研究中使用的儀器多幾百個。我回過頭來告訴那位遺傳學家,我認為白點可能是誤診,它們實際上是“白噪聲”(white noise)。她說:“啊,這解釋了為什麼我們幾年前開始看到診斷出唐氏綜合徵的病例增加,那時新儀器剛送來。”

我們沒做羊膜穿刺,幾個月後迎來了健康的女兒。但這件事讓我備感困擾,尤其是我在大致計算後確信,全世界當天有成千上萬的人被診斷出這種病,其中許多人選擇了羊膜穿刺,導致許多嬰兒不必要的死亡。除非得到解決,否則這一幕日復一日地上演。這件事所揭露的問題涉及的並非我個人的醫療護理,而是整個醫療系統:在不同地方和時間衡量變量和結果,進行統計分析,並在其他地方和時間利用這些結果。這個問題不僅與數據分析本身有關,還與數據庫研究人員所說的數據“溯源”(provenance)有關――籠統地說,數據源自哪裡,從數據得出了什麼推理,那些推理與目前情況之間的相關性如何?雖然訓練有素的人也許能逐一解決所有這些問題,但問題在於如何設計一個能做到這樣的全球規模醫療系統,又無需這種事無鉅細的人類監管。

我還是一名計算機科學家;我想到,構建這種全球規模的推理和決策系統所需的原則,融合計算機科學與統計學,並考慮人類的使用,這些在我所學的知識體系中根本未曾提及。我還想到,開發這類原則至少與構建玩遊戲或感覺運動的技能令人眼花繚亂的AI系統一樣重要――不僅醫療領域需要這類原則,商業、交通和教育等領域也需要。

無論我們是否很快逐漸理解“智能”,我們確實面臨著一大挑戰:結合計算機和人類,又能改善人類生活。雖然有些人認為克服這個挑戰不如開發“AI”來得重要,但其實我們也可以把它看作開闢工程學的新分支。就像過去幾十年的土木工程和化學工程一樣,這門新學科旨在彙集幾個重要思想的力量,在保證安全的前提下,為人們帶來新的資源和能力。土木工程和化學工程建立在物理和化學的基礎上,這門新的工程學科將建立在上個世紀賦予意義的概念的基礎上,比如“信息”、“算法”、“數據”、“不確定性”、“計算”、“推理”和“優化”等概念。此外,由於新學科的重點主要放在來自人類的數據和人類方面的數上據,因此其發展將離不開社會科學和人文科學的視角。

雖然基本模塊已開始出現,但結合這些模塊的原則尚未出現,因此這些模塊目前只是臨時拼湊起來。

因此,就像土木工程出現之前人類造房和造橋一樣,人類著手建造涉及機器、人類和環境的社會規模的推理和決策系統。但正如早期的建築物和橋樑有時無法預見地倒塌,並釀成慘劇,我們許多早期的社會規模的推理和決策系統已經暴露出嚴重的概念缺陷。

而遺憾的是,我們不是非常善於預料下一個出現的嚴重缺陷會是什麼。我們缺少一門有分析和設計原則的工程學科。

目前圍繞這些問題的大討論常常把“AI”用作含義百變的字眼,很難推斷出這項新興技術的範圍和後果。不妨先更認真地考慮“AI”用來指什麼,包括最近和過去。

今天所謂的“AI”(尤其是在公眾圈)主要是過去幾十年被稱為“機器學習”的技術。機器學習屬於算法領域,融合了統計學、計算機科學及另外許多學科的概念,從而設計處理數據、進行預測和幫助決策的算法。機器學習給現實世界帶來了實實在在的影響,並非最近才有。的確,機器學習會給工業帶來重大影響,這在 90 年代初就已經一目瞭然;本世紀初,像亞馬遜這些高瞻遠矚的公司已經在整個公司中使用機器學習,解決欺詐檢測和供應鏈預測等方面至關重要的後端問題,並構建面向消費者的創新服務,比如推薦系統等。在接下來的 20 年,隨著數據集和計算資源迅速增加,機器學習顯然很快不僅會助力亞馬遜,實際上還會助力決策與大規模數據緊密相關的任何公司。新的商業模式會湧現。“數據科學”這個術語開始用來指代這個現象,體現了需要機器學習算法專家與數據庫和分佈式系統專家合作,共同構建可擴展的、健壯的機器學習系統,還體現了因此獲得的系統帶來了更大的社會和環境影響。

在過去的幾年,概念和技術趨勢的這種融合改頭換面成了“AI”。而這種改頭換面值得一番深究。

回顧歷史,“AI”這個術語是上世紀50 年代末提出來的,指用軟硬件創造擁有人類般智力的實體這個雄心勃勃的願景。我們將使用“仿人類AI”(human-imitativeAI)這個術語指這個願景,強調這個概念:這個人工智能實體應該似乎是我們中的一員,即便外觀上不像人類,至少智力上像。這基本上一種學術性活動。

是如果不是身體上相似那麼至少應該從精神上相似(先不管這意味著什麼)。這主要是一種學術願景。雖然運籌學、統計學、模式識別、信息論和控制論等相關的學術領域早已存在,而且常常受到人類智能(和動物智能)的啟發,但這些領域大概專注於“低級”信號和決策上。比如說,松鼠能夠感知它所生活的森林的三維結構,並在樹枝間跳躍,這種能力對這些領域頗有啟發性。“AI”旨在專注於不同的層面:人類“推理”和“思考”的“高級”或“認知”能力。然而60年後,高級推理和思考仍然難以搞定。現在被稱為“AI”的發展成果主要出現在與低級模式識別和運動控制有關的工程領域,以及統計學領域――這門學科專注於找到數據中的模式,並專注於進行有憑有據的預測、檢驗假設和做出決策。

的確,上世紀五六十年代,著名的“反向傳播”算法最初出現在控制理論領域;80 年代初大衛•魯梅爾哈特(DavidRumelhart)重新發現了這種算法,現在它被認為是所謂的“AI革命”的核心。它的早期應用之一是優化阿波羅登月宇宙飛船的推力。

雖然自60年代以來已取得了很大的進展,但成果恐怕不是源自追求仿人類的AI。確切地說,以阿波羅宇宙飛船為例,這些概念常常隱藏在幕後,是專注於克服具體工程挑戰的研究人員的傑作。雖然公眾看不到,但許多方面的研究和系統構建取得了巨大成功,比如文檔檢索、文本分類、欺詐檢測、推薦系統、個性化搜索、社交網絡分析、規劃、診斷和A/B測試等――這些進步推動了谷歌、Netflix、Facebook 和亞馬遜等公司的發展。

人們可能完全同意將所有這些稱為“AI”;的確,人們似乎就是這麼做的。這種叫法可能讓優化或統計研究人員頗感意外,他們一覺醒來發現自己突然被稱為“AI研究人員”。但拋開這方面不談,一個更大的問題是,使用這個定義不明確的縮略詞讓人們無法清楚地瞭解目前的一系列知識和商業問題。

過去二十年工業和學術界取得了重大的進展:常常被稱為“智能增強”(IA)的技術是“仿人類AI”的一種補充。在這方面,計算和數據用來構建增強人類智力和創造力的服務。搜索引擎可以被看作是IA的一個例子(它增強人類記憶力和事實性知識),自然語言翻譯也是如此(它增強人類的溝通能力)。基於計算生成聲音和圖像稱得上是藝術家們的調色板和創意增強工具。雖然這種服務可能涉及高級推理和思考,但目前它們並不涉及――它們主要執行各種字符串匹配和數值運算,以獲取人類可以利用的模式。

希望讀者會容忍最後一個縮略詞,不妨大致設想一下“智能基礎設施”(II)學科:存在一個包含計算、數據和物理實體的網絡,使得人類環境更穩定、更有趣、更安全。這種基礎設施正開始出現在交通、醫療、商業和金融等領域,對個人和社會產生巨大影響。這個話題有時出現在圍繞“物聯網”的談論中,但物聯網通常僅僅指將“物件”放到互聯網上這個問題,而不是指與這些“物件”有關的一系列極其重大的挑戰,這些物件能夠分析那些那些數據流以發現關於世界的事實,並且在比比特高得多的抽象級別與人類及其他“物件”進行交互。

比如說,回到我的個人經歷,我們可以想象生活在一個“社會規模的醫療系統”中,在醫生和植入在人體中的設備之間建立起了數據流和數據分析流,因而幫助人類進行診斷和提供護理。這個系統將把來自人體細胞、DNA、血液檢測、周圍環境和人群遺傳學的信息與藥物和治療方面的大量科學文獻結合起來,它將不僅專注於單個患者和醫生,還專注於所有人類之間的關係――就像目前的醫學檢測讓一群人(或動物)上所做的實驗取得的成果可以用來治療其他人。就像目前的銀行體系專注於財務和支付領域的這類挑戰,這將有助於保留相關性、溯源和可靠性這些概念。雖然人們可以預見到這種系統會出現許多問題,包括隱私問題、責任問題和安全問題等,但應該將這些問題視為挑戰,而不是絆腳石。

我們現在遇到了一個關鍵問題:致力於開發傳統的仿人類AI 是克服這些重大挑戰的最佳或唯一的方法嗎?事實上,機器學習最近的一些成功故事出現在與仿人類AI 有關的方面,比如計算機視覺、語音識別、遊戲和機器人等方面。所以,也許我們應該等待這些領域的進一步發展。這裡有兩點要提一下。首先,雖然無法從報紙上獲悉,但仿人類AI方面的成功實際上很有限――我們遠未實現仿人類AI的願景。遺憾的是,仿人類AI方面取得哪怕有限的進步讓人既興奮又害怕,這導致集體過於亢奮和媒體過於關注,工程界的其他領域並未出現這一幕。

其次,更重要的是,這些領域的成功不足以解決重要的IA和II問題,也不是解決這些問題所必需的。在效率方面,以自動駕駛汽車為例。要實現這種技術,就需要解決一系列工程問題,這些問題與人類能力(或人類缺乏的能力)可能沒多大關係。整個交通系統(II系統)可能更像目前的空中交通管制系統,而不是像目前松耦合、向前看、疏忽大意的駕駛員群體。它將比目前的空中交通管制系統複雜得多,尤其是它使用大量數據和自適應統計建模為細化的決策提供依據。需要重視的正是那些挑戰,專注於仿人類AI可能只會讓人分心。

至於必要性,有時人們認為仿人類AI願景包含IA願景和II願景,因為仿人類AI系統不僅能夠解決AI的傳統問題(比如圖靈測試),還是我們解決IA和II問題的最佳選擇。這種觀點以前很少出現過。

一個相關的觀點是,人類智力是我們知道的唯一智力,第一步我們應該模仿它。但人類其實並不擅長一些類別的推理――我們存在失誤、偏見和侷限。此外,重要的是,我們沒有進化到執行現代II類系統必須面臨的那種大規模決策這種地步,也沒有進化到處理II環境下出現的那種不確定性這種地步。有人可能會說,AI系統不僅會模仿人類智力,還會“糾正”它,還會擴展、處理重大問題。但這是科幻小說中的場景,這種推測性的觀點雖然饒有趣味,但面對開始出現的重大的IA和II問題,不應該是我們在將來的主要策略。我們需要根據事實真相來解決IA和II問題,而不是僅僅視作仿人類AI議程的結果。

不難確定II系統中算法和基礎設施方面的挑戰,這些挑戰不是仿人類AI 研究的核心課題。II系統需要能夠管理分佈式知識庫,這些知識庫在不斷變化,可能在全球範圍內不連貫。這類系統在做出及時的分佈式決策時必須處理雲與邊緣的交互,還要處理長尾現象:一些人方面的數據很多,大部分人方面的數據很少。它們必須克服跨管理和競爭邊界來共享數據的困難。最後,尤為重要的是,II系統必須將激勵和定價等經濟概念納入到統計和計算基礎設施的領域,這些基礎設施將人與人以及人與有價物品聯繫起來。這類II系統不僅提供服務,還在創建市場。音樂、文學和新聞等領域期盼這類市場出現,以便數據分析將生產者和消費者聯繫起來。這一切都必須在不斷演變的社會、道德和法律規範的大背景下完成。

當然,傳統的仿人類AI問題仍然同樣值得關注。然而,目前我們專注於通過收集數據、部署“深度學習”基礎設施以及演示模仿某些定義狹窄的人類技能的系統來開展AI研究,往往會使注意力偏離傳統AI方面懸而未決的重大問題。這些問題包括:需要將意義和推理做入到執行自然語言處理的系統中,需要推理和表示因果關係,需要開發計算方面易於處理的機制來表示不確定性,以及需要開發制定並執行長期目標的系統。這些仿人類AI的典型目標,但在目前圍繞“AI革命”的喧囂中,很容易忘記這些問題尚未解決。

IA也將仍然相當重要,因為在可預見的將來,計算機對實際情形進行抽象推理的能力無法與人類相提並論。我們需要經過深思熟慮的人機交互,才能解決最緊迫的問題。我們還希望計算機幫助人類的創造力達到新的水平,而不是取代人類的創造力(無論這可能意味著什麼)。

約翰·麥卡錫(John McCarthy,曾是達特茅斯大學的教授,後來任職於麻省理工學院)創造了“AI”這個術語,顯然是為了區別於諾伯特·威納(Norbert Wiener)(當時是麻省理工學院的資深教授)的研究工作。威納首創了“控制論”,用來指他自己構想的智能系統――這個願景與運籌學、統計學、模式識別、信息論和控制理論密切相關。另一方面,麥卡錫強調與邏輯之間的聯繫。有趣的是,在麥卡錫的術語這面旗幟下,逐漸在目前這個時代唱主角的卻是威納的理論。(然而,這種情形當然只是暫時的;輪流唱主角的現象在AI界比在大多數領域更常見)。

但我們需要超越麥卡錫和威納的特定歷史視角。

我們要認識到,目前圍繞AI的大討論(專注於行業的狹窄分支和學術的狹窄分支)讓我們可能無視全方位的AI、IA和II帶來的挑戰和機遇。

重點不是實現科幻小說中幻想的超人類機器,而是人類需要了解和引導技術,因為技術在人們的日常生活中變得更有影響力。此外,還需要聽到來自各行各業的不同聲音,不僅僅是技術界的討論。一味盯著仿人類AI會屏蔽掉廣泛的聲音。

雖然行業會繼續推動發展,但學術界也將繼續發揮重要作用,不僅提供一些最具創新的技術理念,還將計算和統計學領域的研究人員與其他領域的研究人員(尤其是社會科學、認知科學和人文科學)結合起來,亟需他們的貢獻和視角。

另一方面,雖然人文科學和自然科學在將來很重要,但我們也不該假裝談論的是規模和範圍空前的工程項目之外的東西――社會旨在構造全新種類的人工製品。我們不想構建這樣的系統:幫助我們研發藥物、促進交通便利和帶來商業機會,結果事後卻發現這些系統其實用不了――它們犯的錯誤反而了影響人類的生活和幸福。在這方面,正如我強調的那樣,面向數據和麵向學習的領域還沒有出現一門工程學科。儘管面向學習的領域似乎激動人心,但還無法認為它們形成一門工程學科。

此外,我們應欣然接受這個事實:我們目睹工程的一個新分支出現。在學術及其他領域,提到的“工程”這個術語常常有狹窄的定義――暗示冷冰冰、無表情的機器,人類失去控制。但是工程學科應該是我們希望它成為的那個樣子。

在當下,我們有大好的機會來構想歷史上全新的東西:一門以人為本的工程學科。

我拒絕給這門新興的學科命名,但如果將來“AI”這個縮略詞繼續用作一個暫定術語,我們應意識到這個術語的限制性。我們應拓寬範圍,少一點炒作,認識到前方的重大挑戰。


分享到:


相關文章: