06.27 深度學習(AI)的現狀和應用案例

深度學習(AI)的現狀和應用案例

一、現狀

作為人工智能一個重要分支的深度學習,也正在受到大家越來越多的關注。2016 年是深度學習高速發展的一年。在這一年中,無論是工業界、學術界還是廣大群眾都投身到了深度學習的洪流之中。在工業界,谷歌(Google)、臉書(Facebook)、百度、阿里巴巴等一系列國內外大公司紛紛對外公開宣佈了人工智能將作為他們下一個戰略重心。在人才方面,繼深度學習界泰斗吳恩達(Andrew Ng)加入百度、Yann LeCun 加入臉書之後,各大 IT 公司開始哄搶學術界大牛。斯坦福大學教授、計算機視覺領域領軍人物李飛飛(Feifei Li)於今年 11 月加入谷歌;卡內基梅隆大學教授、機器學習領域頂級人物 Alex Smola 於今年 6 月加入亞馬遜(Amazon)。在工具方面,谷歌、臉書、百度、微軟、亞馬遜等公司相繼開源了各自的深度學習框架,誰能引領人工智能的潮流將成為各大IT公司的下一個戰場。

3 月:AlphaGo 戰勝李世石

在北京時間 2016 年 3 月 15 日的下午,谷歌開發的圍棋深度學習系統 AlphaGo 以總比分 4:1 戰勝了韓國棋手李世石,成為第一個在 19×19 棋盤上戰勝人類圍棋冠軍的智能系統。AlphaGo 戰勝李世石把深度學習的概念從學術界推向了大眾,並點燃了大眾對於人工智能的巨大熱情。雖然 AlphaGo 不是第一個戰勝人類世界冠軍的系統,但 AlphaGo 的勝利絕對是人工智能歷史上的一座里程碑。

和 1997 年 IBM 的智能系統深藍(deep blue)擊敗國際象棋世界冠軍卡斯帕羅夫不同,完全依靠計算機的運算速度是幾乎無法在 19×19 的圍棋棋盤上戰勝人類的。為了在完整的圍棋棋盤上戰勝人類世界冠軍,AlphaGo 需要使用更加智能的方式。深度學習技術為這種方式提供了可能。在 AlphaGo 的核心組成部分中,估值網絡(Value Network)和走棋網絡(Policy Network)都使用到了深度學習的技術,這也是 AlphaGo 背後真正的大腦。

雖然 AlphaGo 戰勝李世石將人工智能推向了一個新的高度,但它的能力也不應該被過分放大,更不應該認為人工智能全面超越人類的時代即將來臨。因為 AlphaGo 能夠解決的僅僅只是在一個特定環境中定義好的問題,要將人工智能系統真正的應用到開放環境還需要研究人員更多的努力。這也將是 AI 未來發展的方向。

4 月:TensorFlow 發佈分佈式版本

雖然 TensorFlow 已經支持分佈式,但如果類比 TensorFlow 和 Hadoop 系統,那麼 TensorFlow 相當於只實現了 Hadoop 系統中 Mapreduce 計算框架的部分。要將 TensorFlow 真正應用到真實的生產環境仍然存在門檻。為了解決這個問題,才雲科技將 Kubernetes 與 TensorFlow 結合,通過 Kubernetes 實現了對 TensorFlow 任務的監控、調度與管理,讓 TensorFlow 的使用門檻變得更低。

為了解決這個問題,TensorFlow 於今年 4 月發佈了版本 0.8.0。從該版本開始,TensorFlow 開始支持分佈式模型訓練。分佈式 TensorFlow 可以極大的加速神經網絡的訓練過程,上圖展示了分佈式 TensorFlow 的加速比率。從圖中我們可以看到,通過 100 個 GPU 並行的方式,Inception-v3 模型的訓練速度可以加快 65 倍,這使得原來需要半年的訓練過程可以在不到 3 天的時間內得到結果。這也標誌著 TensorFlow 從一個玩具變成了真正能用的工具。在 TensorFlow 0.8.0 發佈不久,DeepMind 也宣佈之後的所有系統都將基於 TensorFlow 來開發。

雖然 TensorFlow 已經支持分佈式,但如果類比 TensorFlow 和 Hadoop 系統,那麼 TensorFlow 相當於只實現了 Hadoop 系統中 MapReduce 計算框架的部分。要將 TensorFlow 真正應用到真實的生產環境仍然存在門檻。不過,將 Kubernetes 與 TensorFlow 結合,通過 Kubernetes 實現對 TensorFlow 任務的監控、管理,可以有效解決這些問題。

6 月:Prisma 圖像風格轉換 App 上線

Prisma 是一款通過深度學習技術改變圖像風格的手機 App。該應用上線之後,在短短一個星期時間內下載量超過了七百萬次,且擁有超過一百萬的活躍用戶。該應用的推出標誌著深度學習技術不僅是一門科學,它更可以被應用於藝術領域。下圖展示了經過 Prisma 處理之後的圖片效果。Prisma 的出現將深度學習技術從高深的學術研究推到了大眾的日常生活,讓其更加廣泛的被大眾所瞭解。在該軟件之後,更多圖像、視頻風格轉換(比如像臉書推出的 Caffe2Go)、自動音樂作曲等軟件被陸續推出。

7 月:谷歌智能數據中心

繼 AlphaGo 之後,谷歌的 DeepMind 團隊將深度學習的技術用在了智能數據中心上。通過增強學習(reinforcement learning),新的數據中心智能系統可以更好的配合機器內的風扇和數據中心的空調使得既可以保證所有機器的散熱,又可以最大限度的降低能源的消耗。通過控制數據中心內 120 多種不同的設備,智能數據中心可以節省大約 15% 的能源開銷,每年為谷歌節省數百萬美元的成本。而且這只是深度學習在智能數據中心應用的開始,DeepMind 團隊還在嘗試安裝更多的傳感器和控制器使得數據中心的能源利用率可以進一步提升。

8 月:SyntaxNet 發佈 40 種語言的語法分析模型

在今年 5 月,谷歌發佈了基於深度學習的自然語言理解(Natural Language Understanding, NLU)算法框架 SyntaxNet,並且提供了訓練好的英語語法分析器 Parsey McParseface。在隨機抽取的 Penn Treebank 新聞數據集上,該語法分析器可以達到超過 94% 的準確率。這樣的正確率已經超過了以往所有的算法,並已經非常接近不同語言學家之間大約 96%-97% 的認同率。不同語言學家對同一句話可能有不同的分析,認同率刻畫了他們之間彼此認同的概率有多高,這也大致給出了計算機可以達到的理論上限。不過這只是在文法非常規範的新聞數據集上,在谷歌從網頁上整理得到的 Web Treebank 數據集上,Parsey McParseface 可以達到大約 90% 的正確率。

在繼 Parsey McParseface 之後,谷歌於今年 8 月又開源了 40 種其他語言的分析模型,並且同時支持文本分割(Text segmentation)和形態學分析(Morphological Analysis)功能。到目前為止,通過 SyntaxNet 開源的模型已經可以分析覆蓋全球半數以上人口的母語,而且在大部分語言上,分析的準確率都是目前全球最高的。上圖展示了使用 SyntaxNet 中文分析模型對中文句子的語法分析結果。深度學習將自然語言處理問題中最基礎的語法分析問題又向前推近了一大步。將這些模型開源將大大加速自然語言處理領域的研究進展。

9 月:谷歌上線基於深度學習的機器翻譯

今年 9 月,谷歌正式發佈了基於神經網絡的機器翻譯系統(Googel Neural Machine Translation system,GNMT)。該系統基於深度學習技術,可以巨幅提高翻譯的準確率。與基於短語翻譯的傳統機器翻譯算法相比,基於深度學習的翻譯算法可以直接翻譯一整句話,這可以大大簡化翻譯系統的設計,同時更高效的利用海量訓練數據。根據谷歌的實驗結果,在主要的語言上,基於深度學習的翻譯算法可以將翻譯結果的質量提高 55% 到 85%。下表對比了不同算法翻譯同一句話的結果。從這句話中,我們可以直觀的看到深度學習算法帶來的翻譯質量的提高。

不同翻譯算法的翻譯效果對比表:

從今年 9 月開始,在谷歌翻譯產品中,所有從中文到英文的翻譯請求都是由基於深度學習的翻譯系統完成。谷歌使用的基於深度學習的翻譯系統完全是通過其開源產品 TensorFlow 實現的,該系統目前每天處理了接近兩千萬次翻譯請求。從中文翻譯成英文只是谷歌翻譯支持的一個語言對,之後谷歌還會將基於深度學習的翻譯算法應用到更多的語言對上。

11 月:DeepMind 和暴風雪公司開始在星際爭霸 2 上開展合作

在今年的 3 月,DeepMind 團隊開發的 AlphaGo 戰勝人類圍棋世界冠軍不是人機博弈的終點,相反,這只是一個開始。DeepMind 在今年 11 月正式開啟了和暴風雪遊戲公司的合作,將他們下一個目標定在挑戰星際爭霸 2這款即時戰略遊戲上。相比圍棋,星際爭霸 2 是一個更加開放的環境,對於深度學習系統的設計難度又有指數級的提高。首先,雖然 19×19 的圍棋棋盤可能有多種不同的狀態,但星際爭霸 2 的狀態總數幾乎是無限的,再加上這款遊戲對即時性的要求,所以將對整個深度學習提出更高的要求。其次,星際爭霸2是一個信息不對稱的系統,玩家只能看到自己的地圖,這要求深度學習系統對“局勢”做出判斷。

在 BlizzCon 2016 上,暴風雪公司宣佈將開發一個對深度學習系統更加友好的 API,從而正式開啟與 DeepMind 團隊的合作。上圖的右側展示了星際爭霸 2 的正常視角,而左側展示了提供給深度學習的視角,這樣可以方便深度學習統更好的獲取信息。相信在不遠的將來,深度學習將被更多的應用到開放環境中。深度學習系統將在更多競技運動中戰勝人類的同時,也將在更多領域將人類從重複勞動中解放出來。

12 月:DeepMind Lab 開源

為了讓深度學習系統能夠自己學會如何解決複雜問題,繼 OpenAI 開源了 Universe 項目之後,DeepMind 於今年 12 月也開源了 DeepMind Lab。DeepMind Lab 是一個專門為人工智能研究設計的第一人稱 3D 遊戲平臺。在這個遊戲平臺中,智能體(agent)需要完成類似收集水果、走迷宮、穿越有懸崖的通道、使用發射臺在空間中移動等任務。如今 DeepMind Lab 已經成為 DeepMind 內部的一個主要研究平臺。

2017 年

相信深度學習將在以下幾個方面將實現質的突破:

深度學習將從大學實驗室和頂級 IT 公司走向大眾,更多的公司將通過深度學習技術解決實際的問題。隨著深度學習工具的開源以及技術的成熟,越來越多的個人和企業將享受到深度學習技術所帶來的好處。

深度學習將覆蓋更多的領域。從 2012 年深度學習突破了傳統圖像識別技術的瓶頸並取得了 ILSCRC(ImageNet Large Scale Visual Recognition Challenge)比賽的冠軍開始,深度學習能被應用到了越來越多的領域。在 2017 年中,筆者相信深度學習將繼續突破傳統技術的瓶頸,並將被應用到基因技術、個性化醫療、自媒體、公共安全、藝術、金融等各個領域中。

隨著 AlphaGo 戰勝李世石,深度學習系統在封閉環境下又取得了突破性進展。同樣在近兩年,相信深度學習系統將更多的嘗試在開放環境下的應用。無論是無人車還是OpenAI戰勝Data2最強非職業玩家,或者是 DeepMind Lab 都將是深度學習在開放環境下的嘗試。

深度學習(AI)的現狀和應用案例

二、應用

1、深度學習的直接應用

語音識別

圖像識別

深度學習推動計算機圖像識別率大幅提升

計算機視覺已經成為最吸引投資的人工智能技術方向

2、深度學習推動多個領域圖像識別廣泛應用

搜索引擎

郵件自動回覆

機器翻譯

殺毒軟件

3、深度學習在視頻行業的應用

視頻的智能化處理

深度學習開創新的商業模式:視頻電商與新型廣告植入

深度學習在醫療行業的應用

醫療行業數據處理要求遠遠超出人類個體信息處理能力

從IBM沃森系統在醫療行業的應用來看,深度學習主要體現在互動、發現和決策三個方面

4、深度學習在金融行業的應用

金融大數據特性決定了引入人工智能技術的必然性

人工智能投資基金表現優異

機器學習和自然語言處理是目前人工智能投資基金常用技術

國內以同花順、資配易為代表的人工智能投資機器人已經初露鋒芒

深度學習顯著提升互聯網金融風控和徵信的能力

深度學習(AI)的現狀和應用案例

​三、重點公司人工智能產品

東方網力:攜手商湯科技,打造深度學習專用芯片體系

同花順:“人工智能+互聯網金融”核聚變

科大訊飛:打造中國“最強大腦”

北部灣旅:收購博康智能,切入“智慧安全、智慧交通”領域

浙大網新:輕裝上陣,踏上人工智能新徵程

思創醫惠:人工智能+醫療新星升起

和而泰:智能家居入口價值日益凸顯

漢邦高科:進軍無人駕駛戰略制高點

百度:深度學習的四大直接應用本質上都是實現分類識別功能

深度學習已經應用到谷歌的各項業務中去

深度e學習具備非常好的通用性:基礎模塊、端到端的簡單模型

深度學習效果隨著數據規模增加顯著提升

谷歌:首次引入深度學習語音識別錯誤率就降低30%

科大訊飛:語音識別近幾年錯誤率明顯降低


分享到:


相關文章: