深度學習和強化學習之間的差別有多大?

侯佳儀


您好!很高興能回答您的問題。深度學習是指把學習內容做進一步剖析。強化學習是指增加學習強度,如:學習時間等。

當一個學生已經把基礎知識學會了,這個時候他必須進行深度學習才能使自己這某一個領域達到一個新的臺階。深度學習就是細化每一個有價值的知識點,不斷研究,總結的過程。比如一個學生知道了物理學中牛頓第一定律,在能熟練運用後,這個時候要進入深度學習,來探究牛頓第一定律的來由。

強化學習往往是在學習強度上加大力度。比如做數學驗算題,如果不經過強度化的練習,是很難在考試中得到質的飛躍的。

最後,希望我的回答能對您有所幫助。








孫梓堯國學教育


深度學習和強化學習都屬於機器學習,而機器學習又是人工智能的一部分。深度學習和強化學習功能的有趣之處在於它們使計算機能夠自己開發規則來解決問題。這種學習能力對於計算機來說並不是什麼新鮮事,但直到最近,我們還沒有足夠的數據和計算能力使其工業化。

什麼是深度學習?

深度學習本質上是一個自學習系統。我們可以使用現有數據來訓練算法以查找解決相應問題的模式,然後使用這種模式來對新數據進行預測。例如,我們可以訓練深度學習算法來識別照片上的貓。具體步驟是:1、讓計算機看數以百萬計的包含貓或不包含貓的圖像。2、讓程序通過對圖像數據進行分類和聚類(例如,邊緣,形狀,顏色,形狀之間的距離等)來建立模式,足夠多的的模式可以得到最終的預測模型。3、讓程序通過預測模型來查看新的圖像集,通過與預測模型的比對來確定圖像中是否有貓。

深度學習算法通過模擬我們大腦神經元網絡的人工神經網絡來實現類似人類大腦的功能。算法在運行中會執行各種循環,通過縮小模式與實際的差距來改進每個循環的預測,最終建立一個最優預測模型。

蘋果的Face ID(人臉識別)就是一個很好的關於深度學習的工業應用案例。Face ID可以通過掃描臉部來訓練算法。每次使用Face ID登錄時,TrueDepth攝像頭會捕獲數千個數據點,這些數據點被用於創建用戶臉部的深度圖,而手機的內置神經引擎將執行預測模型以判斷您是否是您。

什麼是強化學習?

強化學習也是一種自學習系統,但它主要是通過反覆試驗來學習的。通過有限次地執行行動以得到最大化獎勵從而確定最佳答案,換句話說,它是通過實踐來學習,從實踐中找到最佳結果。這就好比我們小時候學騎自行車。剛開始學的時候我們經常會摔倒,但隨著摔得次數多了,我們慢慢就掌握竅門了。這個學習的過程就是強化學習。當計算機使用強化學習時,它們會嘗試不同的行為,從反饋中學習該行為是否能夠得到更好的結果,然後將能得到好結果的行為記住,規範點說就是計算機在多次迭代中自主地重新修正算法,直到能做出正確的判斷為止。

使用強化學習的一個很好的例子是讓機器人學習如何走路。機器人首先向前邁出一大步然後跌倒。這一大步和摔倒是強化學習系統關注的響應點。由於反饋是負面的,所以繼續調整,系統會根據多個負反饋的比對最終確定機器人應該把步子邁的小一點,不停地小,直到機器人走路不會摔倒為止。

近幾年,我看到的最強大的強化學習實驗之一就是谷歌的Deep Mind。谷歌的研究人員把這個工具應用到了經典的電腦遊戲Atari Breakout(一個最經典的打磚塊遊戲)上。他們把最佳目標(結果)設定成了最多的得分,Deep Mind需要做的就是不斷地通過移動底下的擋板來擊打小球以破環屏幕頂部的磚塊。這個實驗的視頻大家可以去百度一下,在實驗的開始,Deep Mind犯了很多低級錯誤,但很快,它就可以擊敗這個世界上最好的擊磚塊選手了。到現在,Deep Mind已經會玩近60種遊戲了。

深度學習與強化學習的區別

深度學習和強化學習首先都是自主學習系統。它們之間的區別在於,深度學習是從訓練集中學習,然後將學習到的知識應用於新數據集,是一種靜態學習,而強化學習是通過連續的反饋來調整自身的動作以獲得最優結果,是一種不斷試錯的過程,這是動態學習。

有一點需要注意,深度學習和強化學習並不是相互排斥的概念。事實上,您可以在強化學習系統中使用深度學習,這就是深度強化學習。關於深度強化學習的更多內容我會在以後的文章裡詳細給大家講解的。


建戈說教育


強化學習和深度學習是兩種技術,只不過深度學習技術可以用到強化學習上,這個就叫深度強化學習.

1.強化學習其實也是機器學習的一個分支,但是它與我們常見的機器學習不太一樣。它講究在一系列的情景之下,通過多步恰當的決策來達到一個目標,是一種序列多步決策的問題。強化學習是一種標記延遲的監督學習。

2.強化學習實際上是一套很通用的解決人工智能問題的框架,很值得大家去研究。另一方面,深度學習不僅能夠為強化學習帶來端到端優化的便利,而且使得強化學習不再受限於低維的空間中,極大地拓展了強化學習的使用範圍。


江蘇專轉本宋老師


深化學習突出的是質,而強化學習突出的是量。對於學習,要區分不同的對象,採用不同的方法。理解能力強,成績優異的學生,要深挖;理解能力差,成績一般的學生,要強化。深化強化正好是因材施教的表現。



分享到:


相關文章: