讀懂人工智能+機器學習+深度學習的包含關係

讀懂人工智能+機器學習+深度學習的包含關係

大數據人工智能技術,在應用層面包括機器學習、神經網絡、深度學習等,它們都是現代人工智能的核心技術。在大數據背景下,這些技術均得到了質的提升,人工智能、機器學習和深度學習的包含關係。

讀懂人工智能+機器學習+深度學習的包含關係


  基本概念理解

  1.機器學習

  機器學習(Machine Learning)也被稱為統計學習理論,是人工智能的重要分支。它通過數據分析獲得數據規律,並將這些規律應用於預測或判定其他未知數據。機器學習目前已經廣泛應用於數據挖掘、自然語言處理、語音識別等,尤其是在搜索引擎領域。

  搜索引擎是人工智能技術發展的先鋒隊,目前百度已經定位為一家人工智能公司,同時搜狗王小川也將人工智能視為未來。在海量數據面前,機器學習的方法成效顯著,具體算法包括決策樹、感知器、支持向量機、馬爾科夫鏈、最近鄰居法等。擁有大規模用戶的搜索引擎業務的公司是最先接觸到大數據的企業,它們對於機器學習的需求遠遠超過其他公司。這類公司利用人工智能技術的原因是希望其搜索結果更加精準,甚至能直接命中用戶答案。

  人工智能的發展經歷了從“推理”到“知識”、從“知識”到“學習”的重要過程,機器學習一直在人工智能的道路上解決問題。機器學習不是一個單一的學科,而是與數學、計算機、生物學等多領域有交叉的學科。機器學習目前不僅應用在搜索引擎中,在生物特徵識別、生物醫學研究、證券分析等裡領域都有深入應用,並取得了不錯的成績。

  從另外一個角度看待機器學習,機器學習的“學習”意味著機器學習的算法嘗試沿著某個維度進行優化,可以理解為它們通常嘗試以最小的錯誤率來最大限度地發揮其預測的可能性。因此產生了三個名稱:錯誤函數、損失函數以及目標函數,因為每一個機器學習算法都有一個學習目標。

  項目或工程中使用機器學習算法時,可以通過確定輸入、輸出以及目標函數和最小錯誤率來評估其算法的作用與效果。

  對於機器學習算法中的輸入和輸出,通常情況下,初步測試的輸入與輸出的對應結果都是錯誤的,如果擁有與輸入有關的輸出結果對應關係,那麼可以通過與期望的輸出結果對比來衡量猜測的準確度,然後使用該錯誤來修改算法,這是有監督學習的常見方式。它們不斷估算輸出結果並修改估算過程的參數,直到錯誤率達到極值。

  2.神經網絡

  神經網絡(Artificial Neural Network)是機器學習的一個重要算法,也是奠定深度學習發展的基礎算法,它的思想影響了深度學習,使得深度學習成為人工智能中極為重要的技術之一。

  神經網絡作為一種常用的方法,是一種通過模仿生物的神經網絡結構和功能的數學模型,也是一種自適應的計算模型。它通過感知外部信息的變化來改變系統的內部結構。神經網絡由許多的神經元組成,神經元之間相互聯繫構成信息處理的龐大網絡。假設做一件事情有多種途徑,那麼神經網絡會告知設計者哪一種途徑是最佳方式。

  神經網絡的優勢在於它是一個能夠通過現有數據進行自我學習、總結、歸納的系統,能夠推理產生一個智能識別系統,從而成為人工智能技術中的重要基石。

  3.深度學習

  深度學習(Deep Learning)是機器學習的重要分支,也是傳統神經網絡的重要延伸。深度學習的網絡結構已有很多,例如深度神經網絡、卷積神經網絡、遞歸神經網絡等。作為多層非線性神經網絡模型,它擁有強大的學習能力,通過與大數據、雲計算和GPU 並行計算相結合,它在圖形圖像、視覺、語音等方面均獲得較好成就,遠遠超越了傳統機器學習的效果,因此深度學習被大眾視為人工智能前進的重要一步。2016 年3 月,以深度學習為基礎的人工智能圍棋應用AlphaGo 在圍棋比賽中戰勝人類圍棋高手,成為熱議話題。

  深度學習目前在圖像處理、語音識別、生物特徵識別等領域中已經獲得了廣泛的應用,並得到行業較高評價,這使得深度學習持續發展,加速推進人工智能的發展。


深度學習與機器學習的關係

  在以往,絕大多數的機器學習方式都是淺層結構,即使採用非線性處理的方式,這些淺層結構的深度往往也不會太深,這種狀況在近十年左右才得以改變;隨著計算能力的增強,計算的深度也在不斷增加。

  機器學習中常見的淺層結構包括高斯混合模型、支持向量機、最大熵模型、邏輯迴歸、多層感知器,等等。實踐不斷告訴我們,淺層結構在解決一些簡單問題時效果比較明顯,但是對於處理複雜多變的問題,例如語音、視頻等則效果較差。

  深度學習的基礎研究源自神經網絡。神經網絡中最為常見的是前饋型神經網絡,倘若具備多隱藏層則可以被稱作深度神經網絡(Deep Neural Network)。深度神經網絡能夠顯著提升問題的處理效果,雖然目前訓練過程中需要強大的計算能力,但是藉助GPU 以及分佈式計算,可以在保障效果的前提下有效提升計算效率。

  深度學習可以處理任何類型的數據,例如:

  (1)聲音。主要針對語音識別、語音合成、語音模擬等。

  (2)文本。包含自然語言處理、自然語言生成等。

  (3)圖像。針對計算機視覺領域,包括圖像分類、圖像目標檢測、圖像語義分割等。

  (4)時間序列。主要在數據傳感、關聯事件分析等細分領域。

  (5)視頻。主要在視頻內容理解,智能視頻廣告等領域。

  深度學習可以解決幾乎任何機器感知的問題,包括對數據進行分類、聚類或對其進行預測分析。

  (1)分類:例如對垃圾郵件和非垃圾郵件的歸檔處理。

  (2)聚類:例如對相似性較高的文檔進行歸檔處理。

  (3)預測:例如根據歷年的氣象數據和最近的天氣變化預測未來一週的天氣情況。

  深度學習非常適用於非結構化數據,例如上面提到的圖像、視頻、聲音以及文本等。一個圖像是像素的組合,一個消息是文字的組合。這些數據沒有按行和列組織在典型的關係數據庫中,這使得淺層結構的機器學習方式對其進行特徵分析相對較為困難。深度學習的常用用例包括情感分析、圖像分類、預測分析、推薦系統、異常檢測等。

  深度學習與人工智能的關係

  從開篇的包含圖中,已知深度學習是機器學習的一個子集,而機器學習又是人工智能的一個子集,因此深度學習是人工智能的一個子技術分支。

  智能程序是一種廣泛應用的計算機智能程序,它可以通過一系列的條件判斷形成,但是這樣的智能程序往往很容易理解,因此智能程序不能視作當前的人工智能。人工智能是面向數據深入地分析結果,結果的推測過程不是人為可快速推測的,而是需要計算機輔助完成。深度學習則是藉助計算機完成的、較好的人工智能技術。

  既然機器學習是人工智能的技術分支,那麼總有部分算法或模型屬於人工智能領域但是不屬於機器學習領域,例如規則引擎、專家系統、進化算法等,它們都屬於人工智能的技術體系,但並不是機器學習。

  深度學習是人工智能一個技術子集。深度神經網絡在一系列重要領域,例如圖像識別、聲音識別、推薦系統等不斷刷新各項指標,甚至超越了人類的認知範圍。由DeepMind 研發的著名人工智能程序AlphaGo,在2016 年擊敗了前世界圍棋冠軍李世乭,這也是深度學習技術對各領域影響的場景之一。

  深度學習中的“深”是一個技術術語,一般而言,它指的是神經網絡中的層數。一個淺層網絡有一個所謂的隱藏層,而一個深層網絡則有一個以上。對於一般簡單的數據特徵,它會從網絡層的一層傳遞到下一層用映射關係表示,而深度神經網絡的層次結構可以表達更為複雜的數據映射關係,以表示更復雜的特徵。人工智能面向的問題也具備多層次數據的複雜特徵,因此深度學習有效地解決了目前各行各業中的部分複雜問題。


分享到:


相關文章: