编辑部都用上机器人了!还不赶快学点人工智能——什么叫“分类”

26日,由新华社和阿里巴巴强强联手成立,素有“

技术公司里最懂媒体、媒体公司里最懂技术”之称的新华智云,一下子发布了25款媒体机器人。据说这些机器人将被主要运用于采集和处理新闻资源,覆盖到了新闻生产的全产业链。

编辑部都用上机器人了!还不赶快学点人工智能——什么叫“分类”

机器人美女主播

妈妈咪啊,小博看到此新闻,不禁惊呼:“这年头不懂点人工智能的知识,靠啥子跟这些机器人耍噻?”想一想,还是得沉下心学点人工智能的知识,毕竟“知己知彼”,才能“百战不殆”。

那今天学点什么呢?先来碟小菜,看看人工智能里“分类”的概念。

日常生活中的“分类”,是什么意思呢?顾名思义,“分类”就是分门别类,将事物按照种类、等级或性质的不同归入各种门类。比如饮料根据是否含酒精分为酒精饮料和无酒精饮料(软饮料),软饮料按照原料和加工工艺的不同,又可以分为碳酸饮料、果汁及其饮料、蔬菜汁及其饮料、植物蛋白质饮料等。

编辑部都用上机器人了!还不赶快学点人工智能——什么叫“分类”

其实,人工智能领域里的“分类”的概念也大同小异。人工智能系统要处理各种各样的数据,最简单的一个操作就是“分类”;“分类”就是要根据所给数据的不同特点,判断它属于哪个类别。下面我们来讲讲最基本的一种分类任务,即二元分类——对两类物体进行分类。下面举个例子:

编辑部都用上机器人了!还不赶快学点人工智能——什么叫“分类”

我国由于幅员辽阔,自然条件差异较大,因此各地都形成了独特的板栗树资源,按大类主要分为北方栗和南方栗。那么,人工智能拿到一颗栗子,是怎么区分它是什么品种的栗子的呢?

编辑部都用上机器人了!还不赶快学点人工智能——什么叫“分类”

其实人工智能系统判断栗子品种的过程很简单,如上图所示:

1)拿到一颗栗子,要先提取它的某些代表性的特征。比如大家都知道北方栗个头小,但是含糖量很高,而南方栗个头大但是含糖量相对较低,咱们就可以提取单粒重量和含糖量这两个特征;

2)把单粒重量和含糖量两个特征输入到事先用数据训练好的

分类器中;

3)分类器就能根据栗子的这些特征来做出预测,然后输出板栗的种类,确定它是南方栗,还是北方栗。

什么是分类器呢?这个能像人一样快速识别出栗子品种,善于完成分类任务的人工智能系统,就被称为“分类器”。它的作用就是将提取的特征量和事物归属的类别意义对应起来。手机上有一款软件叫作“形色”,根据植物的花朵或叶片的特征,就能知道它叫什么名字,用的就是“分类器”。

编辑部都用上机器人了!还不赶快学点人工智能——什么叫“分类”

可是“分类器”感觉好抽象啊,毕竟它不像棋盘上的楚河汉界那样实实在在、亘古不变,机器怎么知道这个分类的标准什么呢,分类的红线又该画在什么地方?大家完全不用担心这个问题,其实机器像人一样通过学习,就能凭经验对未知事物进行有效地判断和分类。只是对机器人来说,这前期的学习不依赖于课本和学校老师,而是一些数据。通过算法得当的训练,人工智能自己就能得到一些准确率高的分类器,并将其应用于未来的场景中

编辑部都用上机器人了!还不赶快学点人工智能——什么叫“分类”

常见的用于训练二元分类器的算法模型,小博能想到的主要有:1)Logistic回归;2)支持向量机(SVM);3)感知机(Perceptron)。有了它们,你就能快速的知道分类的红线到底怎么画,应该画在哪,河南产的栗子属不属于南方栗。有志向的同志可以自行去找相关资料了解一下,数学模型不难,涉及到部分高中函数、解析几何和概率部分的知识,咬咬牙就看懂了。


分享到:


相關文章: