苹果 Siri 被 谷歌 Assistant 甩了十条华尔街

苹果 Siri 被 谷歌 Assistant 甩了十条华尔街

GoogleI/O发布会上,用户对Google Assistant说想剪头发。

Google Assistant先拨通了理发店的电话(这个电话号码应该是用户提前存好的),进行电话预约剪发。对话如下:

苹果 Siri 被 谷歌 Assistant 甩了十条华尔街

这一句“嗯哼”,震惊全场。在人与人的沟通中,想要抓准“嗯哼”的含义,是十分吃力的。当看到Google Assistant巧妙运用“嗯哼”二词的时候,我的内心是澎湃的,因为觉得自己很幸运,生活在这个科技时代。

相比之下,Siri这个傲娇货:

苹果 Siri 被 谷歌 Assistant 甩了十条华尔街

Siri,我......好像听到什么东西碎了!

这也是一项无可厚非的黑科技,Assistant能像你看到的那么“善解人意”,因为使用了称之为

“Duplex”的技术

苹果 Siri 被 谷歌 Assistant 甩了十条华尔街

据谷歌介绍,这项技术是由纽约、特拉维夫和山景城的谷歌工程师和产品设计师联合开发,该技术可实现一小部分人可以完成预订餐厅、查看假日时间等通常通过电话进行的活动。所有这些交互都发生在后端——谷歌数字助理Assistant和餐厅之间。

Assistant可以完成一轮对话,具备了理解上下文的能力,特别是她的声音(现场选用的是女性声音),给人亲切自然的感觉,跟Siri发音完全不同,Siri声音是挺僵硬的。

另外,Assistant是可以用六种声音说话的,任你挑。

Assistant如此“善解人意”的原因,是因为“Duplex”解决了自然对话中遇到的很多难题:自然语言难以理解,人类的自然行为很难建模,人类对延迟的耐受性很低所以需要高处理速度,以及生成听起来自然的语音,其中还要适当地夹杂一些语气词。

在技术上,还使用了一个级联 TTS 引擎和一个生成式 TTS 引擎(其中使用了 Tacotron和WaveNet),根据不同的情境控制语音的语调,这也是Assistant语音能够那么亲切自然的主要原因,一系列的语气词,也是通过这项技术才得以实现的,如你听的“嗯哼”、“uh”等语气词。当级联TTS需要组合变化很大的语音单元,或者需要增加生成的停顿时,语气词就会被添加到生成的语音中,这就让这个系统可以以一种自然的方式向对方示意“是的我听着呢”或者“我还在考虑”(人类说话的时候就经常在思考的同时发出一些语气词)。谷歌的用户调查也确认了人类觉得带有语气词的对话更熟悉、更自然。

这是一项完美的技术?非也!毕竟,到现在为止,并没有完美技术的说法不是吗

?

虽然目前Google Assistant在语言运用上具备了一定的优势,但是这并不代表Assistant能够驾驭任何场合。就算是成功人士,想要轻松应对各种场合,也十分吃力的,更何况智能机器。谷歌官方也曾表示:“现在的技术并没有达到只通过与开发人员对话就学会如何像人一样说话的水平,为了获得高精度,我们在匿名电话的会话数据库上对Duplex的RNN进行了训练。”

技术的背后,总是辛酸的。为了得到更加精准的数据,谷歌用匿名电话的方式,记录下了客户们电话中的通话记录。这样的做法备受争议,因为这直接关系到个人数据隐私和推进技术便利的矛盾问题。毕竟,想要得到精准数据,需要从现实生活中来收集。但这样的做法又关乎到大众的隐私问题。

除此之外,Duplex AI的出现暴露了一些安全风险问题,举个栗子,如何防止某人非法利用公众人物的录音来训练人工智能,并生成伪造的音频?此外,我们还需要防止伪造视频的攻击,鉴于人们已经能够伪造图像和视频(甚至是不健康的),并能够合并一层虚假音频,谷歌和Facebook的内容审核工作将面临着更大的困难。

不管怎样,AI的发展前景是乐观的,大众对谷歌智能AI的发展也是很期待,GoogleAssistant带给我们的惊喜也很大。随着国家相关政策的发布,黑科技的使用会回归到科技的本真,造福全人类。

苹果 Siri 被 谷歌 Assistant 甩了十条华尔街


分享到:


相關文章: