全世界最著名的人工智能公司是哪一家?答案是,DeepMind。如果對這個名字還有一些陌生的話,那麼想必你聽說過AlphaGo。這個人工智能應用程序在2016年戰勝了韓國圍棋國手李世石,讓人類一下子警醒到了人工智能的能力。DeepMind就是AlphaGo的開發者。
DeepMind的早期投資人包括埃隆·馬斯克、彼得·泰爾等硅谷名人。2014年時,谷歌收購了DeepMind。
《經濟學人》旗下的雜誌《1843》,在三四月合刊中,發表了一篇寫DeepMind公司的深度報道。報道通過對25個內部人士的採訪,講述了這家公司開發通用人工智能的想法和挑戰,以及它如何努力保持在谷歌內的獨立地位。
首先是這家公司的創始人和他開發通用人工智能的思路。
DeepMind的創始人叫哈薩比斯(Demis Hassabis)。他16歲時就考入劍橋大學計算機系,22歲時創辦了自己的電腦遊戲公司。29歲時,哈薩比斯回到倫敦大學攻讀認知神經學博士學位。之後,他關於大腦海馬體與情景記憶關係的研究,被《科學》雜誌評選為2007年的“年度突破”。2011年,哈薩比斯創立了DeepMind。他的想法是,找到開發通用人工智能技術的方法。
過往科學家開發通用人工智能的路徑有兩條。第一條路徑基於規則,科學家試圖搞清楚人類思考的所有規則,然後通過程序把這套規則寫出來。這種方法一度非常流行,但卻始終沒有產生出好的成果。第二條路徑想做的,是用數字形式複製大腦的物理網絡結構。但是,研究人員發現,這項任務同樣難以完成。因為大腦中有非常多的神經元,要想完全複製幾乎不可能。
哈薩比斯的方法接近於中間立場,具體就是:參照大腦處理信息的宏觀方法來開發通用人工智能。功能型磁共振成像技術,已經可以讓腦科學家觀察大腦活動時的狀態。通過這種技術科學家發現,大腦會在睡眠時通過回放經驗來學習,以便總結出一個通用原則。人工智能開發者可以效仿這種方法。
這就是DeepMind在開發人工智能時採用的機器學習技術:強化學習。使用了強化學習技術的程序,可以收集有關環境的信息,然後通過不斷重複經驗來學習進化。具體到圍棋來看,程序在熟悉了圍棋的規則之後,通過不斷重複下棋來學習。如果程序走錯了一步,輸掉了比賽,下一次它就知道不該這麼做。程序可以如此反覆訓練自己。AlphaGo就是在這個邏輯下開發出來的。
其次,我們再來看下DeepMind和谷歌之間的關係。這家公司在被收購之後,也努力保持獨立,並且採用了至少三個方法。
谷歌收購了AlphaGo之後,DeepMind的創始人哈薩比斯,並沒有像很多賣掉公司的創業者那樣,用更多時間去享受生活。他繼續執著於開發通用人工智能的願景。
不過他首先要解決的問題是,怎麼在谷歌內部還能保持自己的獨立自主。報道說,2013年大部分時間裡,哈薩比斯都在跟谷歌談判交易條款。他想要達到的目的是:獨立於母公司運營,獲得谷歌提供的所有好處,比如錢和計算能力,但要保持控制權。用他的話說,“它將擁有創業公司的動力、最偉大大學的智慧,以及世界上最有價值的公司之一提供的雄厚財力。”
哈薩比斯為了保持獨立做的工作包括,同谷歌簽訂了一份由倫敦資深律師起草的合同,名為“道德與安全審查協議”。這份合同規定,DeepMind的通用人工智能核心技術,開發出來後,會被交給一個叫道德委員會的管理小組。DeepMind的三位創始人都是這個小組的成員。這樣做,可以防止谷歌公司單方面控制這項技術的知識產權。
此外,還有DeepMind員工對哈薩比斯的忠誠度。哈薩比斯設定的研究議程,吸引了全世界許多科學家加入這家公司工作。此前就有關於牛津大學和劍橋大學的科學家被DeepMind吸引走的報道。對這家人工智能公司的很多員工來說,他們更喜歡DeepMind,而不是谷歌。
然後,是DeepMind的公眾影響力。經過AlphaGo一戰,這家公司已經成為人工智能領域最著名的公司。谷歌數據中心的大量服務器產生的熱量需要降溫。DeepMind還用算法算出了最高效率方法,從而節省下能源。它號稱在2016年已經把谷歌的能源費用降低了40%。這些都讓DeepMind始終受人關注。不過,這需要DeepMind不斷製造出大新聞。
這家公司目前還處在虧損狀態。報道說,公司在2017年虧損了2.82億英鎊,約為25億人民幣。谷歌母公司的CFO波拉特,已經在對公司裡的一些需要長時間投入的業務進行盤點,哪怕它們很酷。因此,自然有人會擔心DeepMind還能不能長久保持獨立的地位。
而且,已經有不詳的前兆發生了。2018年11月,谷歌成立了醫療保健部門,隨後就把DeepMind的醫療部門併到母公司的部門中。這樣做的邏輯是:可以把整個公司的相關研發資源集中起來。道理很對,但報道拋出了一個問題:在開發通用人工智能這個問題上,谷歌會不會使用同樣的邏輯?
最後,報道也指出了DeepMind目前技術的侷限性。
這種侷限包括:首先,DeepMind開發的人工智能程序,能夠在給定的環境下飛速進化,但是,卻不能對環境的微小變化做出調試。而外部世界其實是非常多變和不同的。比如,拿醫療人工智能來說,沒有兩個身體器官是完全一樣的。
第二個侷限是,目前DeepMind開發的人工智能程序,它的成功,取決於非常快速即時的反饋和獎勵功能,反饋和獎勵的信號還必須單一併且清晰。這種反饋與獎勵,可以讓程序知道自己做對或做錯了什麼,進度怎麼樣。但是,“現實世界並不提供簡單的回報,進步很少用單一標準來衡量。”現實世界的反饋往往信號很薄弱、經常會被延遲等。包括人腦也是這樣。人腦很少會收到任務完成的明確反饋。
大數據處理信息服務商金盛網聚WJFabric認為,作為人工智能領域的翹楚,DeepMind最值得稱道的兩項核心競爭力,一是對於行業擁有獨立的思考,二是保持運營的獨立性。在一個先鋒領域,傳統巨頭虎視眈眈,始終能夠以“清流”的方式進行創業,這樣的企業堪稱創業公司的楷模。創業公司最大的特點在於靈活性,包括容錯能力,調頭能力等,而這些能力恰好是推進科技持續進步的重要源動力。如果說創業是一場修行,那麼DeepMind可謂修行路上的智者,他趟出的路對於後來者的借鑑意義不亞於他創造出的技術成果。
閱讀更多 金盛網聚 的文章