黄铁军:人工智能大历史(上)


黄铁军

北京大学信息科学技术学院教授

北京智源人工智能研究院院长

国家杰出青年科学基金获得者

教育部长江学者特聘教授

万人计划科技创新领军人才

主要研究方向:

视觉信息处理(图像识别与视频编码)和类脑计算

荣誉及兼任:

国家技术发明二等奖(2017)

中国科协求是杰出青年成果转化奖(2014)

国家科学技术进步二等奖(2012,2010)

新一代人工智能产业技术创新战略联盟秘书长

国家人工智能标准化总体组副组长

教育部人工智能科技创新专家组工作组副组长

IEEE Transactions on Emerging Topics in Computing编委(AE)

今天讲的这个题目似乎起得挺大的,为什么我一定想起这么一个题目呢?

通常人们都认为“人工智能”的概念是从1956年开始提出的,其发展到目前为止经历了60多年的过程。但是,我认为我们对“人工智能”的思考必须超越60年,只有超越这60年我们才有可能发现未来更重要的和应该做的事情。为此,我给今天的演讲起了这么一个题目——“人工智能大历史”,当然这并不意味着我自己的观点有多么得好,但我希望大家能把这个问题看得更长远一些。

人工智能百年路

黄铁军:人工智能大历史(上)

人工智能发展示意

首先,“人工智能”的概念在1956年被提出。我认为“人工智能”这个词有一定的误导性,大家很理所应当地认为人工智能就是“人设计的一个智能系统”。“人工智能”这个词本来是有这层意思的,但这种理解是不全面的,甚至可以说是很有偏见的。人工智能不一定是人设计的,而且也不应该把人作为智能系统必要的要素。

道理很简单,我们(人类)自身的智能和其他生物的智能并不是由谁设计而产生的,人类是经过进化产生的。因此,机器系统的智能不一定非要依赖人设计的系统来实现,而是要靠机器本身与环境之间的交互来发展。这才是更合理的途径,因此我更愿意讲“机器智能”这个词,它更中立一些。我们需要关注的智能应该是那些出现在机器上的,而没有在我们人类有机体出现过的智能。当我们把这个文字游戏从“人工智能”变成“机器智能”时,其实是在提醒我们机器的重要性,而不是系统设计者的智慧的重要性。

为什么我一定要强调机器的重要性?

因为很多时候,包括从1956年开始提出人工智能这个概念,到1966年开始发展计算机视觉方面的研究,大家一谈到“人工智能”都是把注意力集中在“智能”这个词上面。我自己是研究视觉基因处理的,我在硕士期间研究文字识别,博士期间研究视频编码、图象识别等方面。“计算机视觉”这个词本身带有一种倾向性——在计算机上实现视觉,或者说靠计算机的算法模型来实现视觉。

虽然目前绝大多数计算机视觉方面的研究也是按照这个思路来做的,但这个想法本身的前提是很值得推敲的。为什么我们要在计算机上做视觉?为什么我们必须要用算法来实现视觉?再反过来问,人和生物的视觉背后是计算吗?它们是由一套算法支撑着吗?显然这不可能只靠算法就能实现。也许你可以将简单的生物视觉转化成一种算法,但你也仅仅是在转化,而并不是找到对“实现视觉”这个问题最直接的解决办法。同样地,当我们讲到“机器智能”的时候,应当认识到机器本身是很重要的,而不要轻易地就做出结论,认为我们做智能就是做算法、做模型。

之后,人工智能的发展主要有1986年提出的BP神经网络、2006年提出的深度学习和2016年提出的新一代人工智能。因此,我们通常说的“人工智能发展的60年”就是指从1956-2016年这段时期,人工智能发生了变化,这些变化就是BP神经网络和机器学习的出现,这也是对今天的人工智能影响最大的两个研究方向。

我们国家的新一代人工智能研究是从2015年底开始的,发展规划至2030年,以15年为一个阶段。关于2030年以后的发展情况,目前也有各种预测,这其中就包括了关于强人工智能出现的可能性问题。有些人认为不可能出现强人工智能,而有些人认为很有可能出现。此外,大家对什么时候会出现强人工智能也有各种说法,其中2045年是一个重要的时间点,这个时间是在一次AGI会议上,会议举办方根据与会学者和专家对出现强人工智能的预测时间汇总统计出的结果。如果按2045年计算,那么从现在开始,差不多也是发展30年之后就会出现我们所谓的强人工智能。

上面说的这个30年是从人工智能目前已达到的发展开始往后看,但我们还要往前看,就像我刚才说的,我们不能只看到智能本身这个层面,而要看到更深的一层,也就是要看到是什么样的机器系统、什么样的物理载体在支持智能的发展?事实上,当我们往更深的一层探究时,就会发现我们应该做的事情不仅仅是提出新算法和建立新模型,而是要关注不同的、能够支撑智能的机器。这与我们实际的发展也是相吻合的:1946年第一台计算机出现,1956年人工智能的概念被提出,就是先出现计算机,然后出现算法和机器学习等一系列东西,之后又发展经典人工智能(符号主义),到了20世纪80年代发展神经网络,最后到今天的广泛应用。

因此,我们今天讲的人工智能确实跟计算机的发展有密切的关系,但这并不代表永远都是这样。实际上,对于“计算机到底是不是一个实现人工智能合适的、合理的平台”这个问题,大家一直都有不同的看法。关于这个问题,1986年是一个重要的时间点。1986年是我们现在最热衷讨论的算法的起点,同时也是新一代电脑系统发展的起点。在一批研究者关心算法、不断发展算法的同时,也有一批研究者在关心机器,不断设计研制新的机器。而这些机器会产生更强的智能,这方面的研究也已经发展了30多年,虽然现在我们很多做人工智能的人对这方面讨论得很少,但我认为机器的发展才真正地对人工智能的发展产生了更大影响。

这就好比,一个生物的身体构造或者说脑的结构改变了,那它实现智能的物理基础就改变了。我们都知道,某种生物的脑的进化程度和其构造的复杂化程度,与其智能化程度有着天然的关系,一个低等动物的脑不可能实现高等动物的智能。猩猩的脑神经元数量只有人脑的三分之一,因此猩猩的智能和人的智能,首先在物理层面上就有很大的差距。比如语言方面,我们人类所能掌握的高级语言,对于猩猩来说是不可能实现的,有人做过这方面的研究,十几年来坚持训练猩猩说人的语言,但都没有成功。

原因很简单,猩猩的语言功能没有进化到这个程度,它用来实现这个功能的机器/物理载体的复杂程度与人类之间还有三倍的差距,所以它不可能实现我们期望的高级功能。同样的道理,计算机与能够超越计算机的新机器之间也存在差别,这就是我说的机器的发展能够决定智能的程度,而不仅仅是算法。因此,综合上面所讲的这些去思考人工智能的发展历程,我们不能只看到之前提到的60年(1956-2016年),我们要在这个基础上往前看30年,再往后看30年,这样看到超过100年的发展过程,我们才能对现在人工智能的发展做出更有利的判断和规划。

前几年我将上面所讲的这些内容总结了8个字“智能为用、机器为题”,“题”要比“用”更重要,机器要比功能、现象、算法、模型都更重要。去年中国工程院高文院士在做一个关于人工智能的报告时,又加了4个字“学习为魂”,这是在强调学习本身。这一点也很重要,在具备了物理结构的基础上,智能的发展就需要学习和训练的过程,这和我们人类的成长是一样的,婴儿出生后完整的大脑结构是存在的,在后期成长过程中,通过学习和训练,被灌输各方面的知识,我们学会爬,学会吃,学会使用高级的语言,然后逐渐发展起来。

因此,“智能为用、机器为题、学习为魂”是我通过看人工智能的发展历程,思考并总结出来的想法。

新一代人工智能与

我国未来的规划

关于我国在人工智能领域目前和未来十几年的规划情况,很多媒体都有报道,这里我就不多谈了。我从2015年开始参与了相关的规划过程,总体来说我们的发展目标是我国的人工智能研究到2030年达到世界领先水平。在整个这个目标达成的过程中,国家进行了一系列部署,其中最重要的是关于新一代人工智能发展的重大科技项目。去年已经发布了相关指南,有些老师已经开始申请,今年的指南大约将在6月份左右发布。新一代人工智能的重大科技项目是科技部根据众多与智能相关的项目整合形成的,我把这些总结成了一张图。总体上讲,这个图大致涵盖了我们在人工智能领域想要做的方面,包括基础理论、支撑体系、关键技术、创新应用,以及一些非技术方面的研究。

黄铁军:人工智能大历史(上)

新一代人工智能重大科技项目汇总

关于这个重大科技项目规划,我有几点想在这里跟大家谈一谈:

第一,这个整体规划还是很开放的,尤其在智能相关的基础理论方面,我们到底该做哪些研究,这里面还有很多值得讨论的地方。比如第一个“直觉感知”方面,其实目前很少有人敢说我现在想做一个课题是关于直觉的,这个研究的挑战性是非常大的。人是有直觉的,但怎么让机器产生直觉,这个难度很大。当然规划是鼓励研究者们能有不同方面的想法的,我个人认为,虽然研究直觉这方面难度很大,且很难判断十年之内能否在这方面有所突破,但它仍然是一个很重要的方向,是可能得到支持的。

第二,大家可以从上面这张图里看到规划专门将“软件和基础平台”列出来,软件和硬件方面的研究也是大家比较关心的。既然我们的目标是到2030年达到世界领先水平,那么软件系统和硬件系统都是很重要的。如果我们还是用原有的、其他国家开发的系统,而只是在此基础上调了调算法、提高了几个百分点,那可远远谈不上领先。

因此,软、硬件方面的重要性毋庸置疑,中国的人工智能到底有没有自己原创的思想、能不能引领整个世界的发展,软件和硬件体系必须要建立起来。这个也是新一代人工智能产业技术创新战略联盟要解决的问题之一,我本人兼任联盟的秘书长,目前联盟在牵头做一个新一代人工智能的开源开放平台。“开源开放”这4个字是新一代人工智能规划中的原则之一,中国现在做人工智能的研究是要以开放的方式来做,而不是以秘密的方式。因此我们需要的是一个全面的布局,那么到2030年我们达到的才是真正的领先,无论是在基础理论方面,还是在技术应用方面,都是切切实实的领先了。想要做到这一点,那就需要开源开放平台,它对全世界开放,我们希望至少大家在研究人工智能的时候有很多应用项目是在我们这个平台上发展起来的。

同时,这个平台也是检验大家科研成果的一个窗口。对于现在开始申请的基础理论和关键技术等方面的项目,将来会以开源的方式把这些项目的成果放到平台上去,大家都可以去用。

未完待续

中国“脑计划”以“一体两翼”为整体布局已全面启动,即以“脑认知原理”为主体,以“类脑计算与类脑智能”和“脑重大疾病与健康”为两翼。2016 年 7 月,国务院印发《“十三五”国家科技创新规划》,明确将“脑科学与类脑研究”列为“科技创新 2030—重大项目”之一。上海交通大学出版社正是在这一国家发展战略大背景下精心策划了“脑计划出版工程:类脑计算与类脑智能研究前沿系列”图书。该项目围绕中国“脑计划”一体两翼布局中的其中“一翼”——类脑计算与类脑智能,由张钹院士担任总主编,邀请国内各高等院校及研究所中在脑科学与类脑计算领域的一线权威专家合力撰写。该项目已成功入选“十三五”国家重点图书出版规划,并获2019年度国家出版基金。

黄铁军教授担任“脑计划出版工程:类脑计算与类脑智能研究前沿系列”图书的分册主编之一。

黄铁军:人工智能大历史(上)黄铁军:人工智能大历史(上)

上海交通大学出版社

关注、点赞、留言、转发,分享你的感受

长按二维码关注


分享到:


相關文章: