AI的未來,會如何影響人類的未來?下一個發展方向是什麼?

評論贈書:你認為或者你期待

人工智能下一個發展方向是什麼我們將會選3留言質量較高的用戶,免費贈送《AI的25種可能》。(互動平臺:“第一財經資訊微信公眾號

世界上最聰明的網站Edge,每年一次,讓幾十位全球最偉大的頭腦坐在同一張桌子旁,共同解答關乎人類命運的同一個大問題,開啟一場智識的探險,一次思想的旅行!

這次,包括史蒂芬·平克、朱迪亞·珀爾、丹尼爾·丹尼特、邁克斯·泰格馬克等在內的25位計算機科學家、心理學家、物理學家、科技史學家將話題聚焦到了人工智能,他們探討了AI的25種可能,也是人類未來的25種可能。

今天的文章是對人工智能趨勢的探討,朱迪亞·珀爾對當下火熱的深度學習持懷疑態度:深度學習有自己的動力學機制,一旦你餵給它大量的數據,它就活躍起來,絕大多數時候都會給出正確的結果。可一旦結果錯了,你不會知道哪裡出了問題,也不知道該如何修復。喬治·戴森則認為,計算的未來是模擬。湯姆·格里菲思從認知科學家角度提出了,機器學習的下一個研究領域,必然是人類良好模型。

AI的未来,会如何影响人类的未来?下一个发展方向是什么?| 周末读书

編者:約翰·布羅克曼(John Brockman)

出版社:湛廬文化/浙江人民出版社

朱迪亞·珀爾:不透明學習機器的侷限性

當前的機器學習系統幾乎完全在統計模式或者說模型盲(model-blind)的模式下運行,這在許多方面類似於將函數擬合到大量點數據。這樣的系統不能推理“如果……會怎樣?”的問題,因此不能作為強人工智能的基礎,強人工智能是模擬人類推理和能力的人工智能。為了達到人類智能水平,學習機器需要現實藍圖的指導,這種藍圖是一個模型,類似於當我們在陌生城市開車時給我們指路的道路地圖。

我認為機器學習是一種工具,使我們從研究數據走到研究概率。但是,從概率到實際理解,我們仍然需要多邁出兩步,非常大的兩步。

一是預測行動的結果。第一層是統計推理。統計推理能告訴你的,只是你看到的一件事如何改變你對另一件事的看法。例如,某症狀能告訴你得了哪一種疾病。然後,是第二層。第二層包含了第一層,但第一層卻不包含第二層。第二層處理的是行動。“如果我們抬高價格會怎樣?”“如果你讓我笑了,會怎樣?”第二層需要的是干預信息,這些信息是第一層所沒有的。這些信息可被編碼成概率圖模型,它僅僅告訴我們哪個變量對另一個變量有響應。

二是反事實想象。“如果這個東西重兩倍,會怎樣?”“如果當初我沒有這樣做,會怎樣?”“治好了我頭疼的是阿司匹林還是剛剛打的盹?”反事實在感覺中屬於最高層次,即使我們能夠預測所有行動的結果,但卻無法得到反事實。它們需要一種額外的東西,以等式的形式告訴我們對於其他變量發生的變化,某個變量會如何反應。

因果推理研究的一個突出成就是對干預和反事實的算法化,也就是對層級結構最高兩層的算法化。當我思考機器學習的成功並試圖把它推廣到未來的人工智能時,我問自己:“我們是否意識到了在因果推理領域中發現的基本侷限性?我們準備繞過阻礙我們從一個層級升到另一個層級的理論障礙嗎?”

所以我認為,數據科學只是一門有助於解釋數據的科學,而解釋數據是一個兩體問題,將數據與現實聯繫起來。但無論數據有多“大”,人們操控數據多麼熟練,數據本身並不是一門科學。不透明的學習系統可能會把我們帶到巴比倫,但絕不是雅典。

喬治·戴森:計算的未來是模擬

電子工業在過去的幾百年中經歷了兩個根本轉變:從模擬到數字,從真空管到固態器件。這些轉變一起發生,但並不意味著它們有著密不可分的聯繫。正如使用真空管可以實現數字計算一樣,模擬計算也可以在固態器件中實現。即使真空管在商業上已經消失,但模擬計算仍舊十分活躍。

模擬計算和數字計算之間沒有精確的區別。一般而言,數字計算涉及整數、二進制序列、確定性邏輯和被理想化為離散增量的時間。而模擬計算涉及實數、非確定性邏輯和連續函數,以及存在於現實世界中的連續時間。

想象一下,你需要找到一條路的中間點。你可以使用任何可用的增量來測量它的寬度,然後用數字方法計算出距離中間點最近的增量。或者,你可以使用一根帶子作為模擬計算機,量出道路的寬度然後對摺直接找到中間點。這種方法不受增量的侷限。

許多系統在模擬和數字之間轉換運行。一棵樹將各種各樣的輸入整合成連續函數,但是如果你砍倒那棵樹,你就會發現它一直在用數字方法計年。

在模擬計算中,複雜性存在於網絡拓撲結構而不是代碼裡。信息被處理為諸如電壓和相對脈衝頻率之類的值的連續函數,而不是對離散的位串的邏輯運算。因為不能容忍錯誤或模糊,數字計算需要隨時糾正錯誤。而模擬計算可以容忍錯誤,允許錯誤的出現。

湯姆·格里菲思:我們缺少的是人類的良好模型,機器學習的關鍵必然是人類的學習

價值對齊,就是使自動化智能系統的價值與人的價值對齊。在人工智能研究中,價值對齊只是一個小的主題,但對它的研究日漸增加。用於解決這個問題的一個工具就是反向強化學習。

強化學習是訓練智能機器的一種標準方法。通過將特定的結果和獎勵聯繫起來,可以訓練機器學習系統遵循產生特定結果的策略。現代機器學習系統可以通過應用強化學習算法找到非常有效的策略來玩電腦遊戲,從簡單的街機遊戲到複雜的實時策略遊戲。反向強化學習扭轉了這種途徑:通過觀察已經學習了有效策略的智能主體的行為,我們可以推斷導致這些策略發展的獎勵。

最終,我們需要的是一種方法,它能描述人類思維的運作原理,具有理性的普遍性和啟發式的準確性。實現這一目標的一種方法是從合理性開始,考慮如何讓它朝現實的方向發展。把合理性作為描述任何現實世界行為的基礎,這就存在一個問題,那就是,在許多情況下,計算合理行為需要主體擁有大量的計算資源。如果你正在做出一個非常重要的決定,並且有很多時間來評估你的選擇,那麼花費這些資源也許是值得的,但是人類的大多數決定都是快速做出的,而且風險相對較低。無論在什麼情況下,只要你做出決定花費的時間成本很昂貴(至少因為你可以把這些時間花在別的事情上),理性的經典概念就不再能很好地描述一個人該如何行事。

超級智能人工智能還有很長的路要走。在過去幾年裡,對視覺和語言的模型開發已經創造出了用於解釋圖像和文本的重要的商業新技術,而人類仍然是我們在製造思考機器時要參考的最好例子,所以我認為開發良好的人類模型將是下一個研究領域。

評論贈書:你認為或者你期待人工智能下一個發展方向是什麼我們將會選3留言質量較高的用戶,免費贈送《AI的25種可能》。(互動平臺:“第一財經資訊微信

公眾號


分享到:


相關文章: