云知声CEO黄伟:IoT 时代,我们为什么必须要做芯片?

7月6日,由创业黑马主办的“ 2018 中国独角兽峰会”在京举行,云知声 CEO 黄伟出席活动并发表主题演讲。

黄伟在演讲中表示,我们虽然进入到IoT时代,有一个可以预见的美好未来,但是离真正落地还有很多现实问题需要解决。其中芯片在整个IoT的进化过程中起着非常重要的作用。获得了C轮1亿美金融资后,不久前云知声推出了自研的面相物联网的AI芯片——“雨燕”。

谈及 AI 芯片,黄伟认为只有具备全栈式的 AI 技术能力,已经过验证的、成熟的业务场景和一定的芯片设计能力,三者结合在一起,才有可能真正的研发出一颗有竞争力的芯片。

· PC -移动互联网- IoT 的时代演进

我有幸经历过中国互联网发展的前两个阶段:上大学时我第一次接触 PC ,第一次上网是毕业前去网吧,那时打开一个网页需要几分钟,上网一个小时需要 10 块钱,差不多是我两天的生活费。 2009 年,我离开服务了六年的公司摩托罗拉,加入盛大网络,从学生到工程师,完成了我人生的第一个转变。那是中国 PC 互联网的一个高峰。

紧接着从 2010 年开始,我们经历了中国从 PC 互联网到 Mobile 时代。我们看到中国第一代互联网公司的市值从 10 亿美金左右,翻到 Mobile 时代的阿里、腾讯的几千亿美金。我们也经历了苹果从一个 80 亿美金的市值,到今天为止也成长为大几千亿美金的公司。

这期间发生了什么?以前全球只有几亿台的设备数量,到现在每个人有一台手机、Pad ,移动设备呈现出指数级的增长。以前我们只能在办公室、家,甚至只能在网吧上网、打游戏,今天我们坐在马桶上就可以完成一个游戏的支付。这种设备数量以及技术环境的转变,使得今天我们整个生活方式和社会组织方式都发生了深刻的变革。

今天在发生什么?我们又开始从 Mobile 时代开始进入 IoT 时代,它不再局限于手机、平板,比如像前面暴风冯总介绍的, TV 也可以上网、互动,甚至你们家的灯泡、音箱都是你跟这个数字世界进行交互的一个接口。

我们也不再只是通过手机的按键输入,而是完全可以直接说话,可以对着摄像头做出一些交互的操作。从一个数控时代,开始进入到包括了语音、手势、体感等多模态的交互的任意场景。当然和以前相比,设备数量可能会更大。我们相信这个地球上很快会诞生万亿美金的公司,即使在今天有中美贸易战的情况下,这种趋势还是不可逆转的。

· IoT 时代的机遇与“云端芯”落地

首先,功能会更加智能化,不再只是通过手、嘴巴、眼睛等等。其次,场景化会更加丰富,在家、办公室、汽车等任意场景,我们都能够跟这个世界进行交互,当然设备也变得更加多元化。

我们描述了一个非常美好、伟大的未来,但是离真正落地,还有很多现实问题需要解决。首先我们今天的技术怎么实现一种自然的交互?怎么能在这些场景里面满足用户的体验?因为每个场景必然有它的独特属性,我们能不能在这个场景里做非常好的适配?这些产品并非静止,也不是交付到用户手里这个过程就结束了,我们如何运营、提升用户体验?

另一个很大的不同是价格。手机、平板动辄几千块钱以上, IoT 设备本身是几百块或者是一千块钱左右,你怎么样用一种用户能够接受的方案成本交付给你的客户?当然还有周期,怎么能够用更快的时间、效率交付给客户?这都是我们今天在讲 IoT 想要落地,摆在眼前的几个困难。

2014 年初,我们第一次对外提出“云端芯”一体化的解决方案。因为我们相信人工智能绝对不只是发生在云端,除此之外,一定有边缘智能,而且想要渗入到每个场景,对端一定会提出很多个性化的需求。所以,我们希望通过云端来解决智能终端的一些智能化、场景化的问题。当然我们也希望通过芯片,能够加速 AI 落地的问题。

前面松鼠 AI 智适应教育创始人栗浩洋讲他在 2014 年融资非常困难,其实我相信在中国所有技术创业的团队一开始都会遇到这种问题。因为 2012 年、 2013 年,那时候的资本都在投 APP 、产品创新,没有人去投技术。所以很早之前,当我们说人工智能离不开芯片的时候,也遇到很多挑战和置疑,大家不认为芯片非常非常重要。甚至我记得在 2016 年,中国有很多资本在国外收购芯片公司,我们说芯片是高端制造业,芯片是夕阳产业,但今天我们会发现没有芯片我们什么都不是。

今天回过头来看,人工智能真正落地,它的痛点是在哪里?没有英伟达就没有深度学习,没有英伟达提供的 GPU ,我们不可能开发出非常复杂的深度学习网络。没有一些低成本、低功耗的芯片,我们不可能赋予智能设备一些本地职能能力,所以芯片在整个 IoT 的进化过程中起着非常重要的作用。

在我们的认知里,IoT 的扩基点在于芯片,首先在于场景的选择。因为 IoT 有很多场景,选择就变得非常有技巧,哪些场景是用户真正需要的,哪些场景是今天我们的技术能力满足需要的。

第二,有了场景以后,我们就知道这个场景需要什么能力,我们应该提供什么样的芯片,当然有了芯片以后其实我们可以加速 AI 在这个场景里落地,其实他是一种正向的循环。 AI 芯片也并不是说今天有 PPT ,明天芯片就能做出来,或者说今天开个发布会,6月以后我的芯片就出来了。毫无疑问,做任何事情都是有前提的,过去几年我们的体会是什么呢?AI芯片的制造有 3 个前提,只有当三者合在一起的时候,那么我们才有可能真正的研发出一颗有竞争力的芯片。

1、你必须要有全栈式的 AI 技术能力。

2、一定要有已经经过验证的成熟的业务场景。

3、 AI 芯片它也是芯片,所以说还要具备一定的芯片设计能力。

从 2012 年 6 月份成立,云知声在这一块也积累了一些优势。一开始我们完成了算法平台化的过程。成立了 3 个月之后,我们发布了国内第一个免费开放的语音平台,紧着在 2012 年 12 月 12 号,我们买了 4 个英伟达的语音显卡。在可能学术界 95% 的教授都没有听说过什么叫深度学习的时候,我们就已经开始了。

今天回过头来看,这三件事情非常重要。平台意味着数据;深度学习意味着我们确定了整个算法的框架;当时一个很简陋的 GPU ,意味着我们在那时就开始了对计算能力的追求,到今天我们的计算能力已经接近1000个 GPU 。

这是我们第一个阶段。另外,在发展过程中我们发现,人工智能对计算能力的追求是永无止境的。今天我们可能说自己研发机房的 GPU 已经是以千个 GPU 为单位,包括我们在厦门市政府落地的一个城市大脑的超算平台,每秒的运算能力能达到1亿亿次。这就是我们金字塔最底层的 DeepFlow 集群,它相当于给我们人工智能修了一条高速公路。

那么有高速公路之后,我们会面临另外一个挑战。就像前面冯总说的,电视数据化看起来很简单,其实上面涉及到很多环节,包括信号处理、包括麦克风、语音识别、自然语言理解、语音合成,包括像前面我们主持人和机器人的对话,它通过一种高表现力的合成效果把声音播放出来。

因为人才和热点的关注度还不在这方面,就深度学习来说,你会发现这在 2012 年、 2013 年这个时间来说是不可能现实的。那我们怎么办呢?很简单,运用 AI 来做 AI 人才该做的事情。所以,我们在 2013 年启动了一个项目叫 Atlas 平台,把统计学习和深度学习里面的一些通用算法抽样出来。云知声有自己的 DeepFlow 集群,相当于在高速公路上有一台马力非常强劲的跑车。在这个时代,你有高速公路,有很好的跑车,你不需要很多司机。正是这样,云知声作为一个创业公司,才能非常高效地在语音识别、语音合成等很多技术里,迅速做出国内最顶尖的技术水平,这是我们在一些基础技术上的积累。

云知声比较早的把这个技术深入到场景里面去。我们有什么产品形态?举个例子,在 2013 年底、 2014 年初的时候,我们开始拿出一个芯片模组的原型,希望能用这种产品形态改变今天智能家居的一个应用模式。大家回想一下,在 2013 年底,其实我们看不到 echo ,它是在 2014 年底才出来,但我们在那个时候就开始做这样的事情,到今天我们的芯片模组应用在包括格力、美的、长虹等几乎所有顶级家电品牌中。

所以,在算法、硬件以及场景层面,我们做了非常具体的工作和长期的积累。 2015 年 8 月,我们组建了芯片团队。到今年 1 月 15 号,我们自己研发的芯片正式流片, 5 月 16 号正式发布了芯片“雨燕”,下个月即将大规模量产。

有了芯片之后,给我们带来了哪些改变?我们的计算能力是目前市面上通用芯片的 50 倍以上,而且在端这一侧积累了很多能力之后,我们可以把一些人机交互的共性部分放到芯片里面,不光是语音合成、语音识别,甚至包含我们认为非常复杂的自然语言理解,相当于我们完成了人机交互的最共用部分。

那么,云端我们去对接的各种技术服务和内容服务等等,在端这一侧,我们完全把源代码开放出来,交给我们的合作伙伴、交给渠道。这样云知声我们就完全进入了“云+芯”时代。在不久的将来,大家会看到我们中国产的车里面,我们用的芯片里面,是由云知声提供。

· 我们为什么做芯片?

我们为什么做这个芯片?有一句话是说,“如果你严肃地思考你的软件,你就必须要做自己的硬件”。

最底层的硬件是什么?就是芯片,因为它能够实现算法和算力的完美结合。当然芯片它其实并不是竞争,不是一味的追求说我这个芯片有多少。芯片它是个生态,追求的是一种平衡,你要平衡好计算能力、成本、功耗,只有深入场景,了解行业,才能够真正定义好这个芯片。

我们今年是百箱大战,但是所有的音箱里面,它里面所用到的和远场语音交互的,都是一套模组,要用若干个芯片来实现这样的功能。

第一,今天云知声可以用一个芯片接上2个、4个、6个、8个麦克风,就能实现我们今天所有的功能,体验会更好,因为这个芯片的计算能力要远远超过今天市面上一些芯片的计算能力。

第二,更低的成本、更低的功耗。当然这个芯片我们也可以直接放在一些控制类上面,它既可以离线控制,也可以在线。

我们不止是讲个故事,也不是说停留在算法层面上,而是把算法和行业结合在一起。比如在家居、教育、医疗、汽车、机器人很多领域里,其实我们都取得了一些不错的成绩。

就拿医疗来说。2015年,当我们想把AI和医疗结合起来的时候,中国的任何一家医院,任何一个科室,没有一个医生是用声音来写病例,但是今天我们在中国很多医院,包括像今年卫计委还专门出台了文件,我们中国所有三甲医院的评级标准是必须要有这个语音录入的病例。

我们非常高兴能看到,云知声虽然是一家创业公司,但是通过我们的努力,我们改变了医院,改变了行业。

---------------------------------------------------------

1.本文援引自互联网,旨在传递更多网络信息,仅代表作者本人观点,与本网站无关。

2.本文仅供读者参考,本网站未对该内容进行证实,对其原创性、真实性、完整性、及时性不作任何保证。