干货|深度讲解什么是监督学习、无监督学习、强化学习

本文长度946字,文末有干货

预计阅读时间3分钟

干货|深度讲解什么是监督学习、无监督学习、强化学习

如果你是机器学习的初学者,那你肯定时常为机器学习领域的各种名词而头大。但是请别担心,今天笔者就将以一种简单明了的方式为大家分析讲解监督学习、无监督学习强化学习三个概念:

首先我们先要明确机器学习的概念:简单来说,机器学习是计算机运行一种特定算法的方式。它无需人工直接监督,直接从数据中学习。而机器学习,大体上可以分为监督学习、无监督学习强化学习三个类型:

监督学习

监督学习依赖于有标记的训练数据集。举例来讲:对于一个病人信息的数据集而言,这位病人的性别年龄病史等就是

数据,而这位病人得病与否便是标记。监督学习的算法通过学习数据与标记的关联来找出输入变量(X)和输出变量(Y)之间的函数(Y=f(X))。常见的监督学习方法包括:

  • 回归方法:预测作为实际值的输出变量,例如人的年龄或降雪量
  • 分类方法:当输出变量(Y)是分类时(例如死亡或存活、生病或健康),预测给定数据样本的输出
干货|深度讲解什么是监督学习、无监督学习、强化学习

支持向量机(SVM)实现监督学习(分类)

事实上,神经网络算法就是以实现监督学习为主的(但这并不代表神经网络算法不涉及无监督学习领域)。

干货|深度讲解什么是监督学习、无监督学习、强化学习

强大的神经网络

无监督学习

无监督学习仅使用输入变量(Y),而不使用输出变量

(Y),并且依赖没有标记的数据集来映射数据的基础结构,比如没有确诊的病人数据便是一个没有标记的数据集。常见的无监督学习方法包括:

  • 关联方法:用于揭示一系列项目中某一项的概率(比如著名的“市场篮子分析问题”)
  • 聚类方法:根据相似性对对象样本进行分组(比如确认哪些未确诊的病人属于一类)
干货|深度讲解什么是监督学习、无监督学习、强化学习

聚类方法演示

值得一提的是,神经网络实现的自编码器便是通过将输入变量同时作为输出变量来学习自我复现。这一无监督学习方法可以有效提高神经网络特征提取的能力。(对神经网络感兴趣的读者可以参考文末的干货!)

干货|深度讲解什么是监督学习、无监督学习、强化学习

神经网络自编码器

强化学习

强化学习允许机器根据当前利益最大化的策略决定最佳的下一动作(贪心策略)。例如2017年因为战胜柯洁而扬名全球的AlphaGo便是使用强化学习方法训练的。强化学习在训练机器挑战电脑游戏方面有巨大的优势(比如赛车游戏)。

干货|深度讲解什么是监督学习、无监督学习、强化学习

强化学习流程

常见的强化学习方法是在机器正确完成一个操作后给予一定奖励,计算机会在不断的试探中学习到正确的执行路径。通常,在机器人控制方面我们使用的都是强化学习方法。

干货|深度讲解什么是监督学习、无监督学习、强化学习

用强化学习训练神经网络挑战马里奥游戏


机器学习干货君致力于原创易于理解的技术原理与细节文章

I Studied Hard,

So YOU Don't Have To !

欢迎大家关注: )


相关干货:

  • 想在自己的电脑上轻松配置机器学习开发环境?详见

  • 想要完全理解人工神经网络的本质吗?详见


分享到:


相關文章: