04.28 CPU、GPU都OUT啦!AI芯片了解一下

CPU、GPU都OUT啦!AI芯片了解一下

中兴华为的事儿这两天被讨论烂了,里面涉及到的多数是传统芯片,比如CPU、GPU,但说实话,传统芯片已经不再时髦了。

美国著名科技媒体The Information在去年发布了一篇文章,预测微软、亚马逊等科技巨头,在2018年都会尝试打造自己的AI芯片。

CPU、GPU都OUT啦!AI芯片了解一下

这篇文章可以说非常有预见性,现在包括阿里、Facebook等在内的公司都开始了AI芯片的研发。

CPU注重逻辑,GPU专注运算,而AI芯片,则是为人工智能和深度学习专门开发的。

目前AI芯片大致可以为两类,商用级和民用级。

商用级AI芯片

商用级AI芯片的代表是TPU,由谷歌在2016年正式发布,全名是张量处理器(Tensor Processing Unit),可以辅助谷歌的TensorFlow运行(TensorFlow是一个软件引擎,为深度学习提供驱动力)。

早年深度神经网络用的都是CPU,CPU能处理的事情很杂,全能!后来又用上了GPU,就是我们电脑里的显卡。

CPU、GPU都OUT啦!AI芯片了解一下

主机电脑里的游戏显卡

它专为图像处理而生,但在结构上和CPU没有本质区别。所以GPU除了善于处理图像外,还能用来进行密码破解、金融分析、数值分析等等。比如比特币的挖矿,很多用的就是GPU。

TPU在通用性上最差,它通常只专注于一件事,也正因如此,让它在特定的场合和应用上有极端的效率,所谓“万能工具的效率永远比不上专用工具”。

CPU、GPU都OUT啦!AI芯片了解一下

做个类比,如果说CPU是一个全知全能的老教授,GPU就是100个小学生。算复杂公式,自然前者当仁不让,但如果做大规模的简单计算,比如5+6=11,显然100个小学生的效率更高。

而TPU,则是班里的怪才,可能除法算的特别好,但其他方面的能力几乎是0。

说完了基本面,我们看看它在商用领域的应用场景:

01 下棋

TPU是AlphaGo背后不可或缺的功臣。

起初AlphaGo的硬件平台采用了传统芯片:48颗CPU和8块GPU,AlphaGo的分布式版本则利用了更多的芯片,40个搜索线程运行在1202颗CPU和176颗GPU上。

在与樊麾的比赛中,狗就用的这个配置,因此当李世石看完比赛后,对“人机大战”很有信心,但随后谷歌把硬件平台换成了TPU,结果以绝对优势击败了李世石。

CPU、GPU都OUT啦!AI芯片了解一下

与柯洁对战的AlphaGo其实是一个特殊的离线版本,仅由一个TPU在不连接网络的情况下完成对战,它的体积要比原版小很多,而性能却是翻倍的提高。

谷歌资深硬件工程师Norman Jouppi的刊文表示,谷歌TPU的处理速度要比GPU和CPU快15-30倍(对比的是英特尔Haswell CPU以及Nvidia Tesla K80 GPU),而在能效上,TPU更是提升了30到80倍。

CPU、GPU都OUT啦!AI芯片了解一下

谷歌的TPU已经在各种领域中得以应用,除了围棋,还有谷歌翻译、图像搜索(Google Image Search)、谷歌照片(Google Photo)、谷歌云视觉API(Google Cloud Vision API)等等。

02 服务器

Google作为全球最大的互联网公司,每天会产生大量的数据,为了服务用户,谷歌组件了世界上最大的计算机网络,配备了15个仓库大小的数据中心,在全球四个大陆上都有分布。

CPU、GPU都OUT啦!AI芯片了解一下

六年前,谷歌为安卓系统加入了语音识别技术,也就是我们熟悉的Google Assistant。谷歌工程师很快发现,如果用户每天使用Google Assistant的频率比搜索引擎高,服务器很快会面临崩溃。

但是,谷歌没有选择继续开服务器仓库,而是打起了TPU的主意。

谷歌的TPU专门执行神经网络服务,具体来说,当用户使用安卓手机上的语音助手时,TPU才会运行。

TPU的存在让神经网络可以高效计算,并有了自主学习的能力,大大提高了效率,也给谷歌剩下了好几个数据中心的搭建成本。

CPU、GPU都OUT啦!AI芯片了解一下

TPU业务不断壮大,但谷歌并没有售卖TPU芯片的想法,而是想通过TPU,提供非常好的云服务。

今年2月,谷歌的Cloud TPU对外全面开放,价格为每个Cloud TPU每小时6.5美元。

从下图可以看出,有了TPU的加持,谷歌的云服务在硬实力上已经能和全球最牛的亚马逊AWS相抗衡了。

CPU、GPU都OUT啦!AI芯片了解一下

谷歌的TPU完全是自己研发的,并且只在自家的TensorFlow中效率最高,这里有一定的技术壁垒。

今后,谷歌很可能成为TPU主流供应商,它可以服务于任何一个神经网络引擎,

TPU云服务很可能变成谷歌新的支柱产业。

当然,其他巨头也不想受制于人,Facebook、微软等公司都有自己的神经网络服务,而这些服务都需要海量的计算设备和服务器,TPU是最好的解决方案。

03 自动驾驶

自动驾驶主要依靠的就是各种传感器,在这其中,对于图像的识别和处理又是重中之重。

对于路况数据的处理,通常的办法是在车里塞一个电脑,比如特斯拉就搭载了英伟达开发的Drive PX 2 AI计算平台。

里面包括2个独立的GPU,12个CPU核心,16nm制程,水冷系统等等,性能上相当于150个MacBook Pro,这在传统汽车上是完全见不到的。

CPU、GPU都OUT啦!AI芯片了解一下

这套硬件不是针对特斯拉研发的,它可以处理很多东西,包括激光雷达、毫米波雷达,和摄像头等传感器收集的数据。

如果能在这个“电脑”里塞进一个TPU模块,图像处理就会变得更快,功耗和发热又能有显著减少。

特别像特斯拉这种,不用激光雷达,而以8个摄像头为支撑的无人驾驶模式,TPU将会带来质的提升。

CPU、GPU都OUT啦!AI芯片了解一下

特斯拉新的驾驶系统,增加了摄像头数量

在AI芯片领域,科技巨头们会试图摆脱传统芯片厂商的控制。一方面可以降低成本,也可以进行深度调教。另一方面,英特尔等公司也有些不思进取,它们的产品,显然已经不能满足当下的需求。


民用级AI芯片

相对于传统的CPU和GPU,AI芯片在手机里是新苗子,但是它的作用正在逐步被放大。

华为、苹果、谷歌都为自己的手机开发了AI芯片,上游的供应商,高通和ARM所发售的移动芯片里,都正在使用相关AI技术。

iPhone X搭载了A11仿生处理器,就集成了一个每秒运算次数可达6000亿次的神经网络引擎。

CPU、GPU都OUT啦!AI芯片了解一下

它的存在让iPhone X变得与众不同,比如X的人像模式,可以在拍完后追加灯光效果,其本质就是抠图,识别出人脸,把背景变暗,给脸加亮。

这个识别的过程用到了深度学习技术,如果没有AI芯片,抠图的效果会大打折扣。

CPU、GPU都OUT啦!AI芯片了解一下

同时,iPhone X上的面部解锁也是对NPU的应用。人的脸每天都是不一样的,岁月催人老,更不用说什么化妆、刮胡子这种短时间内的剧烈变化。

而有了机器学习,就能让iPhone X主动适应人的面部变化,而无需你重新录入面部信息。

苹果在其官网的文案描述是:

A11这款芯片能够利用机器学习技术来识别你样貌的变化。当你戴上眼镜、帽子或留起胡须时,你的朋友或许一眼认不出你,但是 iPhone X 可以。

华为旗舰机上使用了麒麟970处理器,上面集成了来自寒武纪授权的NPU专用处理单元。

NPU(neural processing unit)是专为机器学习而开发的硬件,它不仅能执行神经网络所需的高速运算,而且具有杰出的能效。

CPU、GPU都OUT啦!AI芯片了解一下

NPU的加入为Mate10提供了“拍照场景识别”的功能。

相机能对环境进行判断,然后针对特定的场景对照片进行优化。比如相机识别出你在拍天,哪怕有雾霾,也能让天变蓝。

识别出面前是个食物,那必须拍得令人垂涎欲滴;如果是个妹子,就得把对方P得楚楚动人。

NPU的加持,让Mate 10能够对13种场景与物体进行识别,诸如美食、鲜花、文字、动物(狗、猫)、下雪、夜晚等。

CPU、GPU都OUT啦!AI芯片了解一下

如果这个东西做好了,对于照相体验来说可能是颠覆性的。一个非专业人士,只要端起手机,NPU就能自动识别场景,并调出与场景相匹配的最佳拍照参数。按下快门,随手就是一张大片有木有?

高通今年的旗舰处理器:骁龙845,也将AI作为了一个宣传重点。

845支持很多AI框架协议,比如谷歌的TensorFlow,脸书的Caffe 2,给不同的手机厂家开放了AI的应用权限。

CPU、GPU都OUT啦!AI芯片了解一下

骁龙845

厂商们可以给自己的手机开发出更丰富的功能,可以让单摄像头拍出双摄才有的虚化效果,可以进行人脸识别和解锁,智能语音也能变得更快更准确。

CPU、GPU都OUT啦!AI芯片了解一下

科技巨头们在AI芯片上的布局,印证一个芯片产业的发展趋势:在数据比重越来越大的今天,诸如谷歌、微软、阿里、腾讯等公司都会为了数据处理而购买更多的AI芯片。

CPU和GPU等传统芯片依然会在数量上占据主流,但科技公司对于这种通用型芯片的需求会减少。

至于兼顾性能和功耗的AI芯片,将覆盖包括云服务、自动驾驶、智能手机、智能音箱等各种领域,成为支撑物联网革命的关键,带我们进入一个万物有灵的时代。


分享到:


相關文章: