乾貨｜深度講解什麼是監督學習、無監督學習、強化學習_技术 _ 頭條網

本文長度946字，文末有乾貨

預計閱讀時間3分鐘

如果你是機器學習的初學者，那你肯定時常為機器學習領域的各種名詞而頭大。但是請別擔心，今天筆者就將以一種簡單明瞭的方式為大家分析講解監督學習、無監督學習和強化學習三個概念：

首先我們先要明確機器學習的概念：簡單來說，機器學習是計算機運行一種特定算法的方式。它無需人工直接監督，直接從數據中學習。而機器學習，大體上可以分為監督學習、無監督學習和強化學習三個類型：

監督學習

監督學習依賴於有標記的訓練數據集。舉例來講：對於一個病人信息的數據集而言，這位病人的

性別、年齡、病史等就是數據，而這位病人得病與否便是標記。監督學習的算法通過學習數據與標記的關聯來找出輸入變量（X）和輸出變量（Y）之間的函數（Y=f(X)）。常見的監督學習方法包括：

迴歸方法：預測作為實際值的輸出變量，例如人的年齡或降雪量分類方法：當輸出變量（Y）是分類時（例如死亡或存活、生病或健康），預測給定數據樣本的輸出

支持向量機(SVM)實現監督學習(分類)

事實上，神經網絡算法就是以實現監督學習為主的（但這並不代表神經網絡算法不涉及無監督學習領域）。

強大的神經網絡

無監督學習

無監督學習僅使用輸入變量（Y），而不使用輸出變量（Y），並且依賴沒有標記的數據集來映射數據的基礎結構，比如沒有確診的病人數據便是一個沒有標記的數據集。常見的無監督學習方法包括：

關聯方法：用於揭示一系列項目中某一項的概率（比如著名的“市場籃子分析問題”）聚類方法：根據相似性對對象樣本進行分組（比如確認哪些未確診的病人屬於一類）

聚類方法演示

值得一提的是，神經網絡實現的自編碼器便是通過將輸入變量同時作為輸出變量來學習自我復現。這一無監督學習方法可以有效提高神經網絡特徵提取的能力。（對神經網絡感興趣的讀者可以參考文末的乾貨！）

神經網絡自編碼器

強化學習

強化學習允許機器根據當前利益最大化的策略決定最佳的下一動作（貪心策略）。例如2017年因為戰勝柯潔而揚名全球的AlphaGo便是使用強化學習方法訓練的。強化學習在訓練機器挑戰電腦遊戲方面有巨大的優勢（比如賽車遊戲）。

強化學習流程

常見的強化學習方法是在機器正確完成一個操作後給予一定獎勵，計算機會在不斷的試探中學習到正確的執行路徑。通常，在機器人控制方面我們使用的都是強化學習方法。

用強化學習訓練神經網絡挑戰馬里奧遊戲

機器學習乾貨君致力於原創易於理解的技術原理與細節文章

I Studied Hard,

So YOU Don't Have To !

歡迎大家關注: )

相關乾貨：

想在自己的電腦上輕鬆配置機器學習開發環境？詳見

想要完全理解人工神經網絡的本質嗎？詳見

監督學習

無監督學習

強化學習

相關文章:

第二章 IoC容器和Bean配置

運算裡不得不說的python模塊—math

Devops度量--DevOps 現狀快速檢查表

SOP是什麼（解讀）

還不知道交換機上如何配置DHCP，趕緊過來圍觀吧，一分鐘包你學會

還在手動配置IP地址嗎？太Low了，一分鐘教會您如何配置DHCP

Python爬蟲自學筆記：分析頭條文章網頁源文件

DNS偵查工具

國人開源的異步 Python ORM：GINO

程序測評：Create React App 3.3中有哪些酷炫新功能？

“明學”的魅力？我只要我覺得：駕馭終端，提高生產力

（必收藏系列）Linux面試題——命令集

五分鐘學會如何在 IPFS 上部署網站

「正點原子NANO STM32F103開發板資料連載」第29章 內存管理實驗

小白怎麼學Web前端開發 如何成為技術達人

如何開發一個web靜態服務器

學Java編程還有前景嗎 如何才能拿到高薪

Python網絡爬蟲之配置篇（一）

SpringBoot 整合SpringSecurity示例實現前後分離權限註解+JWT登錄認證

Python的運行效率太低？幾行代碼快速提升！

python的優點是什麼？最新Python400集視頻（附教程）

MySQL中OOM故障應如何下手-愛可生

像專家一樣使用 panic

30種不同的編程語言怎麼寫“Hello, World”

percona QAN 介紹

面試官：你可以用純CSS判斷鼠標進入的方向嗎？

網絡工程師職業生涯中，哪兩點是最重要的？

交換機中相關術語代表什麼意思，有必要弄清楚

由淺入深瞭解以太坊 2.0：最常見問題和最全學習清單

【Linux簡單實用小命令001】CentOS 7、8的防火牆端口開放

吃透這些IPFS硬核知識點，日後搶頭礦隨時“彎道超車”

Hive分桶表

Spring中資源的加載原來是這麼一回事啊！

自己動手搭建郵件系統：怎樣讓Exchange Server 發出第一封郵件？

【MySQL】RDS物理備份文件(.idb\.frm)恢復到MySQL自建數據庫

NLP算法入門系列：隱含馬爾可夫鏈(HMM)模型的簡單介紹

第一章 Spring Framework概述

opencv人工智能深度學習這樣實現人臉的年齡檢測

嵌入式linux網絡編程之——5年程序員給你深度講解socket套接字

深入瞭解ProcessFunction的狀態操作(Flink-1.10)

「正點原子NANO STM32F103開發板資料連載」第29章內存管理實驗

小白怎麼學Web前端開發如何成為技術達人

學Java編程還有前景嗎如何才能拿到高薪