發展歷程一覽:深度學習離你並不遠

1997年,世界國際象棋冠軍加里·卡斯帕羅夫對陣一個位“默默無聞”卻異常強大的對手——IBM的(巨型)超級計算機“深藍”。

發展歷程一覽:深度學習離你並不遠

在原先的比賽中加里都擊敗了對手。但是,1997年5月11日的比賽加里輸了,“深藍”成為了冠軍。

“深藍”是第一個在正規比賽中擊敗世界冠軍的計算機程序。

這次比賽吸引了全世界的目光,“深藍”為人工智能的發展奠定了不可估量基礎。同時,數據科學家和軟件工程師開始研究深度學習這個相對未知的領域。

在2018年,深度學習成為了一個熱門詞彙。根據Gartner的研究顯示,深度學習已經不屬於創新發展階段,它步入了人們所預期的頂峰階段。

發展歷程一覽:深度學習離你並不遠

深度學習這一理念還未成為當今社會的主流。然而,與深度學習相關的應用已經滲透到了我們生活的方方面面。

本文是深度學習的入門讀物。在這篇文章裡,作者試圖對基本概念提供一個簡單的解釋,討論其產生的原因,並共同探討深度學習的一些實際應用。

概念

我們首先對人工智能領域中的深度學習進行分類。

發展歷程一覽:深度學習離你並不遠

如上圖所示,深度學習是機器學習的一個子集。機器學習是人工智能(AI)的子集。而人工智能是機器智能化的領域。

基於規則的系統

發展歷程一覽:深度學習離你並不遠

現在我們做一個能夠識別電信公司客戶流失情況的系統。

方法一:制定一個能識別客戶流失情況的系統。通過它找出那些流失的客戶。(這是一項艱鉅的任務。)大量的因素以及不同的排列組合會給系統帶來難以言明的影響。這加劇了系統的不確定性,比如說客戶資料的變化或商業模式的變化,都會給系統帶來影響。

發展歷程一覽:深度學習離你並不遠

方法二:創建統計學習模型。它會從已流失的客戶信息中進行學習。然後生成特定“特徵”,它們會判斷這些“特徵”是否影響了客戶的流失。

要注意的是,這種機器學習模型會過於依賴人類提供的輸入樣本。為了使模型有效,輸入的樣本必須有效。而這也給建模者的直覺和對該領域知識的儲備提出了更高的要求。

深度學習系統

發展歷程一覽:深度學習離你並不遠

顯示的數據與預期輸出一致時,傳統的機器學習模型就可以正常工作了。然而,要考慮的是,由於潛在特徵的數量增加,識別正確的輸入特徵就成為了一項挑戰。所以,在傳統的機器學習模型開發中,大量時間都花費在了對特徵的建設上。比如說客戶流失的例子中,影響客戶流失的因素不止一種。其中一些是未知的,還有一些特性是派生的。

如果這些特徵可以自動學習會怎樣?有解決的方案嗎?

作者認為,深度學習是關鍵。系統基於深度學習,自動識別導致客戶流失的相關特徵,進而幫助人們獲得正確的數據。

自動學習特徵的過程被稱為表現性學習。

神經網絡:深度學習系統的基石

基於深度學習的系統會自動學習相關特徵以解決機器學習任務。

在這裡,需要補充的是,許多簡單的互相連接的節點組成了神經網絡。神經網絡的機器學習算法構建了深度學習網絡。深度神經網絡又是深度學習的基礎算法。

發展歷程一覽:深度學習離你並不遠

深度神經網絡有三種層次:

  • 輸入層:流或輸入數據點

  • 隱藏層:與輸入點互相連接的處理節點。一個深度神經網絡具有兩個以上的隱藏層。

  • 輸出層:將處理後的信息轉換為可用輸出的節點。

在從簡單到複雜的模式識別中,神經網絡先在網絡的第一層學習簡單的特徵,一些節點根據定義的閾值被激活。這些被激活的節點會輸入到後續的網絡層中。以此類推,這是一個將簡單特徵組合起來以獲得複雜特徵的過程。這個過程將不斷重複,直到計算出輸出層中最終輸出的結果。

深度學習並非剛剛誕生。為什麼現在才流行起來?

深度學習的興起

1943年,Warren McCulloch寫了一篇關於神經元的論文。然而,受到以下兩個因素的限制,神經網絡發展備受阻礙:

  1. 缺乏大量可用的數據來訓練深度神經網絡。

  2. 訓練深度神經網絡需要大量的計算能力。

隨著大數據和雲計算的出現,這些問題迎刃而解。

發展歷程一覽:深度學習離你並不遠

如上圖所示,自2000年以來,計算能力增加了10,000倍,存儲數據的成本也下降了大約3000倍。由於互聯網的崛起,智能手機革命和社交媒體的興起,數據的創建數量呈指數級增長。數據無處不在。這三個要素為深度學習創造了一個完美的環境。人們重新燃起了對深度學習的研究的興趣。


主要應用

事實證明,深度學習可以幫助人們執行一些工作或任務。比如說,圖像識別、語音翻譯等。深度學習擅於識別圖像中的圖案或識別特定的對象。也擅於處理語言,理解並對它們做出區分。總的來說,深度學習被廣泛使用於:

計算機視覺

計算機視覺是一個跨學科領域,深度學習負責對圖像的理解。

比如說,

  • 對象識別:對圖像或視頻流中的對象進行分類。

  • 人臉識別:在圖像或視頻流中進行人臉識別。

自然語言處理

自然語言處理是將計算技術應用於自然語言(或語音)的分析與合成。

在2018年1月,深度學習在語音識別領域擊敗了人類。根據斯坦福問答數據集的內容,微軟和阿里巴巴的語音識別模型比人類更出色。

一些使用語音識別的應用程序是:

  • 語音識別:對人類語言的識別。

  • 意圖識別:識別對話或文本中的人的意圖(目的)。

  • 語音到文本/文本到語音的轉換:將語音轉換為文本,或者相反。

結論

在這篇文章中,作者談到了深度學習的核心組成部分,討論了它增長的原因以及它主要應用於哪些方面。

深度學習是人工智能興起的核心,它是一個前景廣闊的領域。未來幾年,它將繼續得到越來越多的採用。深度學習應用程序也將繼續改變我們生活的世界。


分享到:


相關文章: