著名分析師 Benedict Evans:如何才能真正理解「機器學習」?

伴隨著這幾年的炒作,機器學習已經變得非常“普通”。但是很多人在談論或者思考機器學習或者人工智能對我們的經濟體系或者社會帶來什麼影響時,還在不斷地重複著“正確或者不正確的廢話”,比如“數據是新的石油”、“人工智能將接管所有的工作”等等。日前,A16Z合夥人,著名分析師Benedict Evans發表了一篇文章,深入地討論了應該怎樣去思考機器學習,以及機器學習帶來的影響。文章員標題為“Ways to think about machine learning”,由36氪編譯,希望能夠為你帶來啟發。

著名分析師 Benedict Evans:如何才能真正理解“機器學習”?

現在,我們進入機器學習爆發階段已經有四五年了,幾乎每個人都聽說過它。它的影響不僅僅體現在每天都會有新的創業公司出現,也不僅僅體現在大型技術平臺公司正在圍繞它進行自我改造,還在於《經濟學人》或《商業週刊》等雜誌都對其進行了一系列封面報道,許多科技行業之外的大型公司也在推進一些相關的項目。我們知道,這是下一個大事件(Next Big Thing)。

更進一步說,我們基本上都在理論層面上對神經網絡有所瞭解,我們知道,它可能與模式和數據有關。機器學習會讓我們在數據中找到某種模式或結構,這些模式或結構是隱式和概率性的(因此是需要“推斷”的),並不是顯式的,以前只有人才能找到。現在,機器學習解決了一些以前“電腦做起來很難,人做起來非常簡單”的問題,或者是說是“人很難向電腦描述”的事情。此外,我們還看到了一些很酷的(或令人擔憂的,取決於你怎麼看)演講和視覺演示。

不過,我認為我們對機器學習到底意味著什麼還沒有一個明確的概念:即機器學習對科技公司或更廣泛的經濟體系中的公司來說意味著什麼?如何從結構上思考它能夠帶來什麼新事物?或者說,機器學習對我們所有人意味著什麼?它實際上能夠解決什麼重要的問題?

“人工智能”這個術語並沒有提供任何幫助,情況往往是一提起“人工智能”,相關的討論就會結束了。當我們說“人工智能”的時候,就好像電影《2001太空漫遊》(2001:A Space Odyssey)中的黑色巨石出現了一樣,我們都變成了猿類,尖叫著揮舞著拳頭。你不能對“人工智能”進行分析。

著名分析師 Benedict Evans:如何才能真正理解“機器學習”?

事實上,我認為,我們可以提出一堆對發展或更深入理解無益的方式來談論機器學習當前的發展。例如:

  • 數據是新的石油
  • Google和中國(或者Facebook,或者亞馬遜,或者BAT )擁有所有的數據
  • 人工智能將接管所有的工作
  • 當然,也有討論人工智能本身

或許,與此相比,更有用的話題可能是:

  • 自動化
  • 支持技術層
  • 關係數據庫

為什麼是關係數據庫?它們是一個新的基礎支持層,改變了計算的能力。在20世紀70年代末關係數據庫出現之前,如果你想讓數據庫顯示“所有購買這種產品並居住在這個城市的客戶”,通常需要一個定製的工程項目。數據庫的結構不能夠使任何隨意的交叉引用查詢都是一件簡單、常規的事情。如果你想問一個問題,必須有人來去構建它。數據庫是記錄保存的系統;關係數據庫的出現,將它們轉變為商業智能系統。

這改變了數據庫在一些重要方面的用途,從而創造了新的用例和價值數十億美元的新公司。關係數據庫給我們帶來了Oracle,但也給我們帶來了SAP,SAP和它的同行給我們帶來了全球即時供應鏈——它們給我們帶來了蘋果和星巴克。到20世紀90年代,幾乎所有的企業軟件都是一個關係數據庫——PeopleSoft和CRM以及SuccessFactors,還有數十個類似的軟件都運行在關係數據庫上。沒有會說SuccessFactors或Salesforce“永遠不會成功,因為Oracle擁有所有的數據庫”。相反的是,關係數據庫技術成為了一個支持層,成為了所有公司的一部分。

所以,這是今天思考機器學習的一個很好的基礎方式。機器學習會是一個步驟,改變我們可以用計算機做的事情。它將是不同的公司的不同產品的一部分。最終,幾乎所有的東西里面都會有機器學習,也沒有人會去在意。

這裡一個重要的相似之處是,儘管關係數據庫具有規模經濟效應,但網絡效應或“贏家通吃”效應非常有限。如果B公司從同一個供應商處購買相同的數據庫軟件,但同樣使用這家供應商軟件的A公司使用的數據庫不會變得更好:如果Caterpillar購買相同的數據庫,則Safeway的數據庫不會變得更好。機器學習實際上也是如此:機器學習完全是基於數據的,但是數據對於特定的應用來說,也是特定的。更多的手寫數據將會使手寫識別器更好,更多的燃氣輪機數據也將使預測燃氣輪機故障的系統更好,但一個應用的數據對另一個應用沒有幫助。數據是不可替代的。

這就是在談論機器學習時最常見的誤解的核心——在某種程度上,機器學習是一種單一的、通用的東西,在通往HAL 9000(譯者注:《2001太空漫遊》中號稱有完美記錄從不犯錯的人類最高科技的結晶)的道路上,谷歌或微軟各自建立了一個,或者說,谷歌“擁有所有的數據”;IBM有一個實際上被稱為“沃森”的東西。實際上,使用這種視角來看待自動化是錯誤的:在自動化的每一波浪潮中,我們都想象我們正在創造一些擬人化的東西或具有通用智能的東西。在上世紀20、30年代,我們想象鋼鐵俠拿著錘子在工廠裡走來走去,在50年代,我們想象人形機器人在廚房裡走來走去做家務。但我們沒有機器人僕人,我們有用來清洗的機器。

著名分析師 Benedict Evans:如何才能真正理解“機器學習”?

用來清洗的機器是機器人,但它們不是“智能的”。它們不知道什麼是水,什麼是衣服。而且,即使是在狹窄的清洗領域,它們也不是通用的——你不能把盤子放在洗衣機裡洗,也不能把衣服放在洗碗機裡(或者更確切地說,你可以,但是你不會得到你想要的結果)。它們是另一種自動化,在概念上與傳送帶或取放機沒有什麼不同。同樣,機器學習可以讓我們解決計算機以前無法有效解決的各類問題,但每一個問題都需要不同的實現方式、不同的數據、不同的途徑,而且往往需要不同的公司。它們都是自動化的一部分。每個都是用來清洗的機器。

因此,談論機器學習的挑戰之一,就是在數學的機械解釋和對通用人工智能的幻想之間找到中間地帶。機器學習不會創造HAL 9000 (至少,很少有業內人士認為它很快就會創造HAL 9000),但把它稱為“只是統計數字”也沒有用。回到與關係數據庫的相似之處上,這可能相當於談論1980年的SQ。你可以做令人印象深刻的語音識別和圖像識別演示,但同樣,一家普通公司會怎麼做呢?正如前不久美國一家媒體公司的一個團隊對我說的那樣:“嗯,我們知道,我們可以用機器學習來索引十年來我們採訪運動員的視頻——但是我們在尋找什麼?”

那麼,對於真正的公司來說,機器學習中用於清洗的機器是什麼?我認為有兩套工具可以用來思考這個問題。首先是從一系列數據類型和問題類型的角度來思考:

  • 機器學習可以很好地為你提出的問題(而且你得有相關的數據)提供更好的結果,僅僅作為分析或優化技術。例如,我們的投資組合公司Instacart建立了一個系統,來優化個人購物者在超市中的路線,這個系統為相關的超市提供了50%的提升(這是由三名工程師利用谷歌的開源工具Keras和Tensorflow建立的)。
  • 機器學習可以讓你對已有的數據提出新的問題。例如,正在找發現的律師可以用機器學習搜索有關“憤怒的”電子郵件,或者“焦慮的”或異常的線索或文檔集群,以及進行關鍵字搜索。
  • 第三,機器學習可以用來分析新的數據類型——計算機以前無法真正讀取音頻、圖像或視頻,但現在,有機器學習的出現,這種可能性越來越大。

在這裡面,我覺得分析影像是最令人興奮的。以前,只要我們有計算機,就能處理文字和數字,但圖像(和視頻)大多是不透明的。現在,它們可以像“閱讀”一樣,去“看到”圖像和視頻。這意味著圖像傳感器(和麥克風)變成了一種全新的輸入機制——與其說是“攝像頭”,不如說是產生(潛在的)機器可讀數據流的新的、強大的和靈活的傳感器。今天看起來不像計算機視覺方面的問題都將變成計算機視覺方面的問題。

這不是關於識別貓咪圖片的問題。我最近遇到一家為汽車公司提供座椅的公司,它在一個便宜的DSP芯片上安裝了一個神經網絡,並配有一個便宜的智能手機圖像傳感器,用來檢測面料是否有褶皺(我們應該期待在非常小的、便宜的小部件中使用各種類似的機器學習用途,只做一件事,就像這裡所描述的一樣)。把它描述為“人工智能”是沒有用的:它只是將一項以前無法自動化的任務能夠自動化了。

這種自動化的感覺是思考機器學習的第二種工具。發現面料是否有褶皺不需要20年的經驗,它只需要一個哺乳動物的大腦。的確,我的一位同事認為,機器學習可以做任何你可以訓練狗做的事情,這也是思考人工智能偏差的一個有用的方式(狗到底學到了什麼?訓練數據中有什麼?你確定嗎?你怎麼問?),但也是有限的,因為狗的確有通用的智力和常識,不像我們所知道的任何神經網絡。吳恩達(Andrew Ng)表示,在不到一秒鐘的時間裡,機器學習就可以做任何你能做的事情。談論機器學習更像是在尋找一種比喻,但我更喜歡這樣的一種比喻:它給了你無限多的實習生,或者是無限多的10歲的孩子。

五年前,如果你給一臺計算機一堆照片,它只能按尺寸大小進行排序。一個10歲的孩子可以把照片按照男人和女人進行分類,一個15歲的孩子可以按照酷和不酷對照片進行分類,一個實習生可以按照有趣與否來進行分類。今天,用機器學習,計算機可以做10歲和15歲孩子做的事情,它可能永遠做不了實習生做的事情。但是如果你有100萬個15歲的孩子來看你的數據,你會怎麼做?

也就是說,機器學習不需要像有數十年經驗專家那樣進行判斷。我們不是讓專家自動化。相反,我們會要求“聽所有的電話,找到有憤怒情緒的電話”。讀所有的郵件,找到有焦慮情緒的郵件。看10萬張照片,找到看起來很酷的人。

從某種意義上說,這是自動化一直在做的事情。Excel沒有給我們帶來人造會計師,Photoshop和Indesign沒有給我們人造圖形設計師,蒸汽機也沒有給我們人造馬。(在早期的‘人工智能’浪潮中,國際象棋計算機並沒有給我們一個在盒子裡的脾氣暴躁的中年俄羅斯人。)相反,我們大規模地將獨立的任務自動化。

在某種意義上說,機器學習不僅能找到人類已經能識別的東西,而且能找到人類無法識別的東西,或者找到10歲(或50歲)的人不能識別的模式、推論或暗示的層次。最好的例子是Deepmind 的 AlphaGo。AlphaGo並不像國際象棋計算機那樣下棋,而是通過依次分析每一個可能的動作。相反,它被賦予了規則和一塊棋盤,並讓它試圖自己制定策略,與自己進行比人類一生所能做的更多的遊戲。也就是說,與其說這是1000個實習生,不如說是一個速度非常快的實習生,你給你的實習生1000萬張照片,他們回來說“這是一件有趣的事情,但是當我看到第300萬張照片時,這種模式就開始出現了”。那麼,哪些領域足夠狹窄,我們可以告訴一個機器學習系統規則(或者給它打分),它能夠讓我們看到所有數據,就像人類永遠做不到的那樣,並帶來新的結果?

我花了相當多的時間拜訪大公司,談論它們的技術需求,它們通常有一些非常明顯的觸手可及的機器學習成果。有很多顯而易見的分析和優化問題,還有很多明顯的圖像識別問題或音頻分析問題。同樣,我們談論自動駕駛汽車和混合現實的唯一原因是因為機器學習能使它們成為可能——機器學習為汽車提供了一條途徑,去了解周圍情況和人類駕駛員可能會做什麼,如果我正在戴一副可以顯示任何東西的眼鏡,這就會為混合現實提供了一條瞭解我應該看到什麼的途徑。但在我們討論了面料是否有褶皺或情緒分析之後,這些公司的相關人員往往會停下來問,‘那麼,還有什麼呢?’機器學習還能實現哪些其他功能,以及它將發現哪些未知數?我們大概還有10到15年的時間,才會對這一切感到無聊。


分享到:


相關文章: