"让电脑如成人般地下棋是相对容易的,但是要让电脑有如一岁小孩般的感知和行动能力却是相当困难甚至是不可能的。"
汉斯·莫拉维克在上世纪80年代提出的这个观点让持传统观点的人大吃一惊。在人们的传统观念里,智慧最重要的特征是那些困难到连高学历的人都会觉得有挑战性的任务,例如象棋,抽象符号的统合,数学定理证明和解决复杂的代数问题。至于四五岁的小孩就可以解决的事情,例如用眼睛区分咖啡杯和一张椅子,或者用腿自由行走,又或是发现一条可以从卧室走到客厅的路径,这些都被认为是不需要智慧的。
和传统假设不同,莫拉维克等提出,人类所独有的高阶智慧能力只需要非常少的计算能力,例如推理;但是无意识的技能和直觉却需要极大的运算能力。这正应了那句话,困难的问题是简单的,简单的问题是困难的。
有人认为这是因为像感觉、运动、图像识别这些智能是人类用了几十亿年的时间才进化出来的,而像逻辑推理这种高级智慧却只是在最近的几十万年内才发展出来。
不管是什么原因形成的,无意识的技能和直觉却需要极大的运算能力这个猜测如今却得到了人工智能最新进展的佐证。我们以图像识别为例,现在图像识别使用一种模仿人类神经系统的深度神经网络的技术来识别图像分类。
如图所示,一个神经元通常具有多个树突,主要用来接受传入信息;而轴突只有一条,轴突尾端有许多轴突末梢可以给其他多个神经元传递信息。轴突末梢跟其他神经元的树突产生连接,从而传递信号。一个神经元可以简化为多个输入信号经过一个激活函数转化为一个输出信号的一个模型。
而神经网络是多个神经元连接起来构成的一个网络拓扑。如下图所示
对于图像识别这样的任务来说,我们可以把许许多多的照片的像素数据作为输入数据输入神经网络的输入层,而在输出端根据实际结果来反复调整神经网络拓扑里各个神经元连接间的权值,这过程也叫做神经网络的训练。通过大量的数据训练后,神经网络就可以在以后的实际应用中对新输入的任意图像数据做出分类预测,且这样的识别准确性甚至在一些领域内已超越人类自己的准确率。
深度神经网络在工程上可以用计算机算法程序来实现,这使得我们有充分理由相信,我们人类的大脑其实本质上就是一台生化计算机,所有的无意识的技能和直觉,辨识人脸、举起铅笔、在房间内走动,就是一个算法而已。尽管我们人类的算法,和深度神经网络这样的算法目前还并不完全一致。
要用深度神经网络这样的算法程序来做一个图像识别工作,对程序员来说要比做数学题要难得多。像是比如"1+2+3+……100"这样的数学计算,对普通人来说是件非常困难的难题,但对任意一个普通程序员来说,几行代码都可以轻易搞定。而相反对于图像识别这样我们普通人来说完全自然本能的行为,计算机程序员实现起来可要难得多,而且计算机耗费的计算资源也要大得多。