如果说汤唯能够随时随地伴随你身边,替你指引方向,为你选择最优的路线……这种生活是不是美好得不太现实?
12月24日,百度地图官方宣布汤唯正式签约代言人,同时上线“汤唯导航语音”。在“说”的领域,百度地图这款“新一代人工智能地图”又迈出了一步。
你可能从未想过,你的百度地图其实是一个超级先进的人工智能工作舱,你的每一次点击,舱里的工作人员就会在指挥官的命令下,将你所需要的数据反馈给你,而且这真的不是科幻小说里的桥段,汤唯小姐姐早已穿上了百度地图“AI算法官”的制服!
没错!这次汤唯女神化身百度地图“AI算法官”,目的就是要探寻人类内心深处的秘密:到底想要什么样的地图?
这些人类总是很奇怪,有时候有近路非要绕远;有时候没有路的地方反而更乐意去走走看;更奇怪的是有时候明明特意规划的路线却说自己是无意间走到的……汤唯小姐姐任职以来,见识了各种各样奇奇怪怪的要求,为了让百度地图能够满足人类的任何要求,她和工作舱里的工作人员展开了对人类内心想法的深刻研究。
据汤唯算法官的研究,目前大部分产品的语音识别率都达到了95%以上,却无法像人类一样表达,其根本原因就是还“不懂人”。
何为“懂人”?我们人与人之间可以从对方的音量、声调、语速、用词等方面听懂对方的要求、情绪、心情、状态,这就是所谓的“懂人”。
说得直白点就是“情感表达”,这是目前而言语音合成技术需要攻克的关键要素。
想要达成这一目标,针对普通生活场景的语音合成是提高情感表达的最佳方式。目前使用语音合成技术播报下天气或者阅读简讯,无疑能合成出完美的语音,但遇到生活化的场景,或者在特定氛围之下,语音合成的效果就会降低很多。一方面由于系统对韵律信息的捕获不准确,另一方面由于生成的声学参数存在误差。当语音合成可以完美消化各类生活化的语境时,其应用场景将得到极大的拓宽。
另外,在语音合成的应用中,大多都是单人、单语言、单语音,如何能由单变多也是语音合成应用中的一大困扰。在“3单”语境的限制下,语言合成技术难以完成应用突破,而目前一些解决“3单”语境的解决方案也不够完美,或多或少都存在瑕疵,并且也没有足够的语料素材来进行支撑。百度地图在深度神经网络技术的支撑下,已经开始对“3单”语境作出反应,并已收到成效,百度语音合成开始支持中文英文混读,可以提供数十种不同音色,更支持语速、音调、音量设置。这些技术活功能上的增加,无疑将给语音合成带来更加广阔的想象空间。
这一下,汤唯小姐姐可算是渐渐明白了人类到底想要什么了,与十几年前相比,“地图”的概念发生了翻天覆地的变化,现在的地图早已不是印在纸上的一张图,它变得可以拖动、放大。从AI技术应用来看,百度地图已经表现出强大的AI能力,除了能提供实时路况、提前规划路线,推测拥堵等智能地图的“常规功能”外,百度地图开始提供更加个性化的交互,例如,AR实景导航、全景地图、旅游地图、充电桩地图、急救车让行播报等个性化功,这些创新功能不止是听觉还包括视觉上。
值得一提的是,百度智能地图还能够“学习”不同路段对应的交规信息,这一点是极具应用价值的。
由此可见,百度地图AI化已经真正意义上实现了从技术端走到了应用端。
閱讀更多 第—知訊 的文章