大话人脸识别（二）：起起落落，横空出世

人脸识别并非自人工智能概念诞生之时就有了——那是很久之后。

1936年5月计算机科学之父艾伦·麦席森·图灵向伦敦权威的数学杂志投了一篇论文，题为《论数字计算在决断难题中的应用》。在论文的附录里他描述了一种可以辅助数学研究的机器，后来被人称为“图灵机”，是为计算机思想的启迪。

计算机之父图灵，也被誉为人工智能之父

1950年，图灵再次发表了论文《计算机器与智能》（Computing Machinery and Intelligence），第一次谈到人工智能，这为后来的人工智能科学提供了开创性的构思。

同样在1950年，图灵发表了著名论文《机器能思考吗？》，这篇划时代的论文，也使得图灵被誉为“人工智能之父”。

此后在1956年，约翰·麦卡锡在达特茅斯（Dartmouth）学院正式提出“人工智能”概念。

如果说图灵提出的图灵机、人工智能概念开启了人类对机器具备智慧的梦想，那么约翰·麦卡锡在达特茅斯（Dartmouth）学院提出的人工智能概念，使得人类确立了人工智能的研究目标，自此人工智能正式成为计算机科学中一门独立的经验科学。

这也使得约翰·麦卡锡同样被认为人工智能之父。

同样被誉为人工智能之父的约翰·麦卡锡

但此时人脸识别还远未诞生，因为此时的计算机仍然是晶体管计算机，是个庞然大物，几乎没多大用处。

然而，随着科技的发展，尤其是计算机技术的发展，科学家们对于人工智能的热情一路高涨。

1957年，康奈尔大学教授Frank Rosenblatt提出“感知器”的概念，并通过算法定义出了世界上第一个神经网络，从此人工智能的发展有了清晰的方向。

这是第一起，人工智能的崛起，也是以神经网络为代表的首次崛起。

而作为人工智能算法的人工神经网络，到底该如何来进行验证其有效性，也成了人工智能发展的一大问题。

但随之而来的另外一个问题，使得以神经网络为基础的人工智能发展进入了低潮期，这个问题就是人工神经网络需要耗费巨大的计算资源，而这对于当时还不怎么先进的计算机技术来说，不具备可实践性。

之后的几十年(一直到2006年)以神经网络为基础的人工智能一直处于低潮期。

这是第一落，以神经网络为代表的首度没落，但人工智能的发展并未没落，只是换了个方式而已。

而这另一个方式就是：支持向量机(SVM)。贝尔实验室的Vladmir Vapnik就是其中的代表人物。

如果说人工神经网络是模拟人脑的整个过程，那么支持向量机(SVM)就是在走捷径，更注重结果，支持向量机(SVM)就有点像在考试时，直接抄答案，它的效果来的更快更直接。

在那个计算机速度还不是很先进的年代，SVM，作为一种人工智能分类算法，九十年代初开始，在图像和语音识别上，找到了广泛的用途。

这是第二起，图像识别的首次崛起，也是支持向量机技术的崛起。

至此开始，人脸识别的祖先——图像识别开始广泛地作为人工智能算法的试验场，不断的得到改进。

1998年，以SVM为技术的手写邮政编码的识别能力上，错误率降到低于 0.8%。

值得一提的是，虽然以神经网络为基础的人工智能处于低潮期，但该领域的代表人物Yann Lecun，在1989年提出的“反向传播算法在手写邮政编码上的应用”，并用美国邮政系统提供的上万个手写数字样本训练这个神经网络系统，最终错误率只有5%。

自此之后，无论哪个派别，图像识别几乎是所有人工智能算法的试金石，每年，都有相关代表参与到人工智能图像识别算法的竞赛中来。

而这其中最为有代表性的就是ImageNet大赛。

2009年, 一群在普林斯顿大学计算机系的华人学者发表了论文 "ImageNet: A large scale hierarchical image database), 宣布建立了第一个超大型图像数据库,供计算机视觉研究者使用。

这个数据库建立之初,包含了三百二十万个图像。它的目的，是要把英文里的八万个名词，每个词收集五百到一千个高清图片，存放到数据库里.最终达到五千万以上的图像。

2010 年，以 ImageNet 为基础的大型图像识别竞赛，ImageNet Large Scale Visual Recognition Challenge 2010 (ILSVRC2010) 第一次举办。

2010年竞赛的第一名, 是NEC 和伊利诺伊大学香槟分校的联合团队，用支持向量机 (SVM) 的技术，识别分类的错误率为28%。

2011年竞赛的冠军，用所谓 Fisher Vector 的计算方法(和支持向量机技术类似)，将错误率降到了 25.7%。

2012年，Hinton教授和他的两个研究生首次将深度学习((本质即计算机神经网络))的最新技术用到ImageNet竞赛，错误率一下子就降低到 15.3%，震惊了业界。

自此以后，以计算机神经网络为基础的图像识别算法，总是保持领先，且进步飞快，而支持向量机的图像识别算法，开始逐渐没落。

这是第三起，以神经网络为代表的再度崛起；也是第二落，以SVM为代表的没落。

2013年的ImageNet大赛，冠军是来自纽约大学的Matt Zeiler，其图像识别的top-5错误率，降到了11.5%。

2014年的冠军是称为InceptionNet的计算机神经网络，其top-5错误率为6.7%，这个神经网络有22层；

到了2015年，由微软研究院的Kaiming He等4名华人提出的ResNet(Residual Neural Network)，通过使用Residual Unit成功训练152层深度的神经网络，在ILSVRC 2015比赛中获得了冠军，取得3.57%的top-5错误率，同时参数量却比VGGNet低，效果非常突出。

可以说2015年前后是一个转折点，因为2015年ImageNet的竞赛结果显示，人工智能图像识别的错误率低于5%。

而这俨然已超越了人眼的误识率，人工智能图像识别领域的重头戏——人脸识别已经准备好了。

可以说，伴随着以神经网络为代表和以SVM为代表的人工智能发展的起起落落，图像识别终于迎来了它的春天，但人脸识别的横空出世，如果没有这位“贵人”的相助，恐怕现在还待在实验室里。

这个贵人会是谁呢？

且看下回分解：贵人相助

分享到:

閱讀更多 聞西說科技 的文章

關鍵字: 数学达特茅斯学院人工智能