06.05 清華 AI 公開課:人工智能在企業的落地是一門大學問

清華 AI 公開課:人工智能在企業的落地是一門大學問


新智元整理

【新智元導讀】上週,清華 AI 公開課迎來最後一講,本講主題是:落地的人工智能。講者楊強是香港科技大學講座教授,華人首個AAAI Fellow和IJCAI理事長,第四範式公司聯合創始人。 楊強教授作為邀請講者,與清華大學海峽研究院大數據 AI 中心專家委員雷鳴等共同探討了 AI 在當前和未來將產生的影響和落地的場景。

課程回放地址:

http://www.xuetangx.com/livecast/live_cast_lecture/livecast-reading/798/?spam=rgzn531

清華 AI 公開課:人工智能在企業的落地是一門大學問

在課程開始,雷鳴老師先概述了對產業有較大影響的技術,以及未來將發生的演變。

從技術角度看,未來對產業產生比較大影響的技術有:

  • 基於視頻的信息理解和處理技術。現在,基於靜態的圖片的處理技術,比如人臉識別、物體識別等,已經達到了可用的水平。但是,在視頻分析和處理方面的研究才剛剛開始,還沒有非常有效、成熟的技術。
  • 自然語言對話、理解和處理。尤其是半開放環境的對話,難度還很大。
  • 強化學習。未來將在自動駕駛、廣告等領域產生影響。
  • 內容生成相關技術
  • 小樣本學習和遷移學習。在樣本匱乏的情況下解決問題。

產業在未來可能發生的一些演變:

  • 首先是自動駕駛。以前我們還會討論自動駕駛是不是有落地的可能,是不是太危險、太科幻了。但現在來看,我們認為自動駕駛的落地只是時間的問題。今年很快,百度的小批量量產自動駕駛汽車就會投入使用,真正實現商業化。
  • 第二是智能醫療。智能醫療最近的發展很快,以醫學影像的發展為牽引,在一些特定領域的進展很不錯。FDA最近剛給出了AI診斷的第二個license。
  • 智能教育。探討教育的難度比較大,因為教育不是一個客觀問題,是一個交互式的,高維度的問題。所以AI全面介入教育的“智能老師”難度很大,但是以個性化教育作為切入,在一些特定領域,比如作文評分、作業批改、個性化出題等,已經在不斷改變教育的生態。
  • 智能助理。去年開始進入一種非常白熱化的競爭階段,未來會進一步的落地,通過迭代,會在更多垂直應用上越做越好。
  • 遊戲及娛樂。個性化、娛樂內容的生產。
  • 智能製造。中國是製造大國,如果疊加智能製造,可以大幅度提高中國製造的水平和能力。中國在軟件方面發展較快,但硬件上的話,無論是芯片還是其他重要零部件製造,跟國際水平差距還很大。要承認差距的客觀存在性,依靠中國巨大的市場,大力加大研發投入。不能僅靠國家,整個產業的企業和國家要一起把這部分發展起來。
  • 智能農業。中國是農業大國,在智能農業上已經有一些發展。比如用無人機進行病蟲害巡檢、定向農藥噴灑、大棚的溫控,病蟲害檢測等,未來都有一些非常實際的應用場景。

整體來看,AI在各個行業都有很多落地的場景,未來AI自身的發展結合落地的場景,應該會產生很多創新。

楊強:一個AI,兩種模式

清華 AI 公開課:人工智能在企業的落地是一門大學問

楊強:今天的題目很應景,叫 “落地的人工智能”。這個題目是拿來跟大家探討的,因為這是一個大題目。人工智能到現在已經 60 多年,幾起幾落,它的興衰也是圍繞著 “AI是不是可以落地” 進行的。

今天的講座,第一部分是人工智能概述。

人工智能分為四個發展階段。初級階段是感知環境

(Perception),我們知道單層的神經網絡也叫 perceptron(感知器),是 60 年代就出現的可以簡單學習的神經網絡。這是 AI 必要的一步,因為要有感知智能,才能收集大量數據,這一階段需要傳感器、互聯網、物聯網等技術。

第二個階段是機器學習(machine learning)階段。能從數據裡面學習。第三個階段是自動推理(reasoning),需要搜索、邏輯、博弈論等技術。最後也是最高階段是抽象遷移(abstraction),需要有新的理論和系統。

清華 AI 公開課:人工智能在企業的落地是一門大學問

一個AI,兩種模式

  • 通用 vs 特殊:有很多人試圖解決通用 AI,但現在絕大部分工作還是在特殊的、任務驅動的人工智能。
  • 輔助 vs 自動:比如計算機視覺是輔助型的,相當於給機器戴上了眼鏡。無人車是自動型的,因為它的整個運作是自動的,也有自動的學習能力,人類只是為它提供一些必要的資源。
  • 交互 vs 核心:交互型的 AI 是為了跟人溝通,是閉環的。還有一種做法是把 AI 作為一個核心的系統,它的副產品是對人有用,但它可以完全按照自己的方式發展。AlphaGo 就是一個例子。

說到人工智能落地,第一個問題就是什麼叫“落地”,誰來規範什麼時候AI可以算作“落地了”? 這個標準是首先要建立的。在任何科學與工程領域,都要首先建立測試“成功”的準則,否則就會事倍功半。要知道,智能的測試是非常難以做到公正的,也經歷了很多的考驗,比如著名的“聰明的漢斯”,是對一匹叫做“漢斯”的馬的智能測試,因為一開始沒有注意到高維的特徵空間,而得到了錯誤的結論。圖靈測試是一種更合理的測試,但也不是唯一的測試。

我認為深度學習的成功主要來自兩個方面:第一,層次之間的演化是一種非線性的轉化,這種轉化如果進行多次,就有可能產生高維空間的 pattern。第二,所有這些加起來,這個網絡本身成為一個特徵產生器,產生一個高維的空間,在這個空間裡,世界上的任何東西(圖像、語音等)都會有統一的表達,並且你可以計算它們的距離。

高維度的、統一的特徵表達,這就是人工智能想達到的目標。所有的推理、類比、抽象等,都可以在這個空間裡得到。但這個空間是通過在數據中學習獲得的,這個手段在現階段是通過大數據,但大數據不是唯一的手段。

AI為什麼要有不斷創新的能力?

AI 領域每年有上千甚至上萬的 paper,是不是說我們就可以躺在 open source 上面,不用創新了?不是的,我們很有必要不斷地創新。

一個例子是 GAN,它的一個作用是可以 “魚目混珠”,生成器可以創造出一些虛假的圖片。在金融界就發現有這樣的人,他們對深度學習瞭如指掌,並且可以用AI深度學習的這些手段去欺詐金融的安全系統,因此我們必須要有不斷提高的反擊的能力。

第二,有些新的學科,比如遷移學習,非常依賴對數據的模擬。GAN 在這個方向是非常有用的工具。

清華 AI 公開課:人工智能在企業的落地是一門大學問

創新的能力也可以體現在跨界的AI應用上。一個例子是斯坦福大學的一個工作,他們的任務是幫助聯合國通過衛星圖像,讓機器自動地給非洲大陸打標籤,這些標籤指代地區的“貧困程度。” 但是我們看到一個衛星圖像,由於標籤的缺乏,我們對圖像上對應的貧困程度是一無所知的。傳統的做法是派人到本地做經濟調查,然後把數據收集起來。這樣的做法既危險,又耗時,不準確,數據也非常少。

有沒有辦法自動地做這件事呢?他們想到了遷移學習,而且是多步的遷移學習。第一步是拿 ImageNet 這種圖像來學一個切割模型,第二步是比對白天和晚上的衛星圖像,以此獲得一個初步的經濟模型。因為一般認為晚上比較亮的地方是經濟發展比較好的區域。由此得出一些 feature 對應經濟發達或不發達的地區。最後的結果,用 survey 的方法的準確率是 75%,用遷移學習的方法準確率是 71%。雖然沒有人工的那麼好,但是非常省力。

我們現在已經有了不少“遷移學習”在產業應用中的實例。如果已經有了大數據產生的模型,那麼在一個新的領域,可以用小數據把大模型遷移過來找到這個領域的要點就是找出兩個領域的不變量。我們假設一個領域可以用上億維的特徵來描述,那麼我們要找兩個領域的特徵空間共有的部分來做遷移。

AI落地

網約車識別

這裡的一個例子是上海汽車的網約車識別

這個問題是:給定車輛的行駛軌跡,如何判斷車輛是否網約車?

我們的策略是引入外部數據來進行遷移學習。外部數據有出租車、公交車的行車軌跡。分兩步:首先我們有兩個空間,左邊是出租車的空間,右邊是網約車的空間,我們的目的是把知識從左邊搬到右邊。但是很明顯兩邊的知識是有差異的,要把這些差異剔除,我們用了半監督學習 + 遷移學習。

清華 AI 公開課:人工智能在企業的落地是一門大學問

這個例子告訴我們,AI 的落地首先要目標清晰,清晰到可以把優化函數用數學公式寫下來。

第二,需要去找到合適的數據

第三,人才需要領域知識,同時也需要 AI 知識,這種跨界的人才才是 AI 真正需要的人才,否則談不上落地。

然後,我們也來舉一個反例。我們都知道,AI的頭幾個里程碑都是IBM創造的。但是在AI落地的過程中,IBM也遇到了難題。一個例子就是IBM WATSON在醫療領域的落地。

我們先來看一下IBM WATSON的流程。 首先,當一個問題到來的時候,系統把輸入的問題和知識庫裡的問題加以對比,再按照匹配的概率排序。 如果有匹配度高的問題,那就可以把對應的答案作為輸出。 在這個流程中,需要知識庫的建立,和問題集的收集。當然,這個流程中又很多依靠機器學習的階段,比如問題的特徵抽取,特徵空間的建立,匹配的相似度學習,等。但整個流程的建立還是要依靠專家來進行的。比如,知識庫的建立,知識的擴展,以及問答系統在整個醫療系統中的定位等。恰恰因為這些需要人工的地方成為瓶頸,以至於最終用戶的定位錯誤,導致系統並沒有完成既定的任務。最後,IBM只能從美國一個很大的醫療機構撤離,也導致了媒體大量的負面報道。

總結起來,這個例子說明,僅僅在一個遊戲領域成功(問答的電視大賽),並不表示在開放的實際場景(醫療)就可以取得成功。 首先,IBM Watson的目標客戶群是醫生,還是病人? 系統的角色是助手還是替代? 有沒有既懂醫療又懂AI的專家在團隊中? 系統有沒有做到前端和知識庫的維護的閉環?這些有關落地的問題,都有待回答。

總結:

第一,人工智能是走了很長的路,但是除了深度學習以外,還有很多的領域有待發掘。所以千萬不要以為深度學習就是人工智能

第二,人工智能在企業的落地是一門大學問,而且是一門藝術性的學問,因為還沒有到科學的程度。所以一個問題是,AI 是產品,還是技術,還是解決方案?第二個問題是,AI 如果在一個領域落地成功,需要哪些基本條件?

最後,我覺得非常有趣的一個點,是 AI 出現了以後、會出現一個新的、以機器智能為主體的產業和社會。那麼這個新的商業社會也可能會部分地顛覆我們已有的商學院的知識。現有的商學院的知識主要是針對人的管理和人的決策。那麼 AI 對應的是機器的管理和機器的決策,這個學問現在還是空白。


【加入社群】

新智元 AI 技術 + 產業社群招募中,歡迎對 AI 技術 + 產業落地感興趣的同學,加小助手微信號: aiera2015_3 入群;通過審核後我們將邀請進群,加入社群后務必修改群備註(姓名 - 公司 - 職位;專業群審核較嚴,敬請諒解)。


分享到:


相關文章: