一盏台灯开启AI的端智能时代

语音交互的云平台和本地端应用

语音交互技术作为人工智能重要的一个分支领域,从最初由声控虚拟助手来补充云端的语音信息库,到大量的误听、误解命令的服务机器人、智能音箱等产品的出现,发展到现在的,一盏台灯、一个晾衣架、一台风扇,更多本地端的语音交互应用也逐渐被细分出来,但是否这样的端智能就会是机器智能交互的最终形态呢?

一盏台灯开启AI的端智能时代

(欢迎补充,数据持续更新…)

就目前来讲,做语音交互云平台的数量是要多于做端智能的企业,两者的区别在技术本身除了联网之外,并没有太大的差别,可是反馈到终端产品以及应用场景中,就会带来一些不同的体验感,其一是功能性,端智能的功能更加明确,错误理解率会小于云智能,命令反应时间也会快于云智能,但端智能能够满足的产品功能种类会比较单一,目前还只适用于简单的家电控制,像台灯、风扇、空调等。

其二是趣味性,这也是功能性的延伸,由于云端不受资源的限制,可以有更大的数据库,更强大的语义理解功能,除了可以增添家电控制、天气、交通、时势信息的查询等硬性功能外,陪伴聊天、娱乐也成为了云端智能的新颖噱头以及未来可能的发展方向。简单点来说就是在端智能和云智能的优缺点中做一些取舍,假如我们需要更多种类的软性趣味功能,就势必会有一些硬性的功能方面的小瑕疵。

一盏台灯开启AI的端智能时代

互问以AM1032作为分布式家居中的智能节点,和现在形态还不确定的家庭中控实现分布式智能家居平台

处理语音数据的技术赶不上其增长的速度

前端语音的处理或许在比较安静稳定的环境里面体现不出来太大的差别,但是如果在汽车、室外等并不稳定的环境里,设备的“听力”就会变得格外重要,毕竟听不到又怎么能听懂,何况就现实来看,不稳定的环境因素是必然存在的,所以无论是云智能还是端智能,想要有更多的应用场景、更好的智能体验效果,都是需要不断提升前端语音处理技术的。

目前市面上有提出两种解决方案,都是利用高性能数字信号处理芯片DSP(Digital Signal Process)技术来实时进行语音识别,互问的圆形麦克阵列板是其中之一,这是一个将软硬件结合的方案,它的拾音距离是10米范围内(连续可调),具备回声抵消、声源测向、混响消除、噪声抑制、可调拾音方向、可调拾音距离等一系列功能。还有一种解决方案是美国的Synaptics公司提出,是可以通过软件的方式来处理,目前可达到在噪音较大的环境下进行远至5米的无缝语音控制。

一盏台灯开启AI的端智能时代

Synaptics的官网图片

从中心化过渡到去中心化,是否任意端都可以成为中心?

由于上面的两个原因,BAT企业大都会首先选择发展云智能,提供云平台服务,尽管应用领域的侧重点不同,但并不影响他们建立自己的云端数据中心,最终这些数据细分输入到不同的领域的应用场景中,成为一个个能够进行语音交互的机器设备,可能是会像文章一开头所讲的台灯、风扇一样,也有可能是某个类似智能音响一样的中央控制器。

从现在发展的趋势来看,从中心化过渡到去中心化,似乎是必然的发展规律,但如果想要构建一个像科幻电影里面一样:可以掌握听、说、读等多种能力、适应更多可变化的场景和环境、能自我完成多数任务的机器人管家,一个真正的人工智能集合体,就一定是建立在大数据共享的条件之下。

这就需要每个端智能都成为一个中心,或者说是将端智能和云智能的方式相结合,这目前是一个尝试,毕竟目前的技术已经解决了部分的简单任务,像单一的家电控制,这些清晰而简明的数据信号。但是如果有那么一天我们需要面对更为复杂智能化,以及其背后更具生命性的特征时,我们是否就会有取舍和决断。毕竟有些观点是说,如果我们想要绝对的智能我们也将不再会有隐私。


分享到:


相關文章: