透过语音落地300家法院这扇窗,一窥阿里云「产业 AI」的四大特点

2017 年可谓人工智能波澜壮阔的一年,这一年,我们见证了各种「人机」大战,也被一次次 PPT 上炫酷的未来场景所震惊,同时又在霍金、马斯克等人的「警告」中陷入对人类未来命运的绝望中,但所有这些看似炫酷、又听起来发自肺腑的声音却都有意无意遮盖了一个事实——同时也是人工智能的出发点,那就是

技术应该为人类所用

这恰好也是本周云栖大会·北京峰会上所传递出来的声音,正如阿里云的掌舵者胡晓明所言:「人工智能不应仅仅是实验室里的、PPT里的概念上的‘AI’,更是‘产业AI’。」所谓产业 AI,也就是将人工智能(以下简称 AI)的相关技术与不同的垂直行业相结合,从而真正实现人工智能新技术(如语音、图像、自然语言处理)在各个「旧」行业的落地实践。

事实上,自 2016 年开始,阿里云就已经在城市交通、工业制造、医疗、金融等垂直行业推动人工智能的落地实施,到了 2017 年,产业 AI 的理念又在智慧法院、智能家居、民航机场调度等行业有了充分展现。

透过语音落地300家法院这扇窗,一窥阿里云「产业 AI」的四大特点

这其中,智慧法院的产业 AI 实践颇具代表性。

根据相关媒体报道,阿里云已经将自身的 AI 技术,尤其是语音技术「渗透」到了 300 多家法院、6000 多个法庭之中,而在此次北京峰会上,阿里云又和深耕法律信息化二十多年的华宇软件达成深度合作框架协议,将进一步推进 AI 在法院的落地和普及。

作为政务信息化的一部分,司法行业的信息化一直在有条不紊地进行中,然而过往的技术发展,尽管一定程度上提升了行业效率,但还无法给行业带来真正意义的改变。那么,不妨将镜头拉近到这 300 家法院里每个法庭,透过这些落地案例,可以窥见产 AI 实践中的三大特点。

特点一:新技术与特定场景的融合

以法院法庭为例,长期以来,如何将庭审时的记录自动化,曾是一件遥不可及的事情。当然,有需求一定会有解决方案,比如就有一些公司将语音识别卖给法院使用,当另一个尴尬的事实是,当一个语音识别系统将一个小时的庭审语音转化为几百页的文本记录时,不管是原被告双方现场签字还是后续的搜索摘录,反而又成了一件效率低下的事情。

透过语音落地300家法院这扇窗,一窥阿里云「产业 AI」的四大特点

此时,再炫酷的新技术,倘若无法与特定产业场景的结合,都无法带来真正的价值。对此,负责阿里巴巴 iDST 语音团队的鄢志杰表示,这种特定场景下的语音识别,还需要和自然语言理解进行深度整合,比如,可以不可以通过自然语言理解的其他技术,将这些庭审记录的精华提取出来,这样不仅能解决了庭审记录的自动化,还大大减轻了法庭书记员的工作,从而大大提升了法庭的庭审效率。

类似地,如何让 AI 与工业制造相结合,不仅是考验包括传感器、实时数据分析等技术能力,更考验这些技术如何在制造业工厂现实场景下的应用困难。也因此,在推动工业大脑的过程中,阿里云的工程师们往往会在车间第一线了解不同场景下的技术需求,从而能够有针对性部署相关技术,毕竟,对于制造业企业而言,不存在所谓非要不可的炫酷技术,而一定需要真正能给企业带来价值提升的实用技术。

特点二:技术平台与生态共赢

产业 AI 的落地实施不可能由一家公司完成,需要技术平台供应商,如阿里云,与不同垂直行业合作伙伴共同合作努力才能实现。从城市大脑项目的十几家包括软硬件的合作伙伴,到工业大脑中与行业龙头徐工集团共建「徐工工业云」,阿里云践行了技术平台供应商的义务和责任,在此次智慧法院的落地实施中,华宇软件成为重要的合作伙伴。

透过语音落地300家法院这扇窗,一窥阿里云「产业 AI」的四大特点

当记者问及为何选择阿里云作为合作伙伴时,华宇软件全资子公司华宇元典总经理邹劭坤表示:相比于某些公司什么都想独占的做法,阿里云的生态平台理念更具吸引力。

而从技术公司的发展角度去看,依托技术平台,共建行业生态的做法也是一个最理性也具有长远价值的选择。这意味着,技术平台公司可以更专注于底层技术的开发和维护,不同行业合作伙伴都可以在这个技术平台上获取不同的接口和应用程序,结合自己对行业的理解和标注的知识库,从而开发行业应用或提供行业专属服务,其最终结果就是:技术平台供应商、应用服务开发/提供商、终端企业用户的三方共赢。

特点三:单点技术突围后的联动效应

从技术上看,自 2015 年兴起的这波人工智能浪潮并无太大心意,所解决的也是人工智能过往 60 多年里的几个难题:语音、图像和自然语言理解。但这一次技术发展的却有一个不同,那就是上述几个技术的爆发几乎都出现在同一个时间点。

透过语音落地300家法院这扇窗,一窥阿里云「产业 AI」的四大特点

这一点意义重大。这意味着,当语音、图像与自然语言理解都到了一定发展阶段后,机器智能在某种程度上具有了所谓「能听、会看以及基本理解」的能力,这些能力与现实场景,尤其是产业场景的整合,所带来的效果远远超过单点技术,如语音、图像所能产生的价值。

比如在杭州的「城市大脑」萧山区的 120 救护车优先调度的案例里,就将图像识别与自主决策等系统进行了深度整合。这是因为,从 120 接到电话到患者进入医院,这个过程中涉及到多个交通参与主体,而且交通路况又是随机、动态变化,如何让机器自主决策,制定一个最快路线成为关键。紧接着,120 救护车上路后,实时的定位和道路上每个摄像头的实时图像捕捉,都需要精确计算才能完美实现。

而在智慧法院的推进过程中,正如上文所言,单点语音识别无法解决真实场景下的需求,再结合自然语言理解后所带来的效率提升已经超过「1+1=2」的效果。更进一步,能不能让机器成为法官的小助理呢?比如,结合语音(庭审记录)、文本(笔录、判决文书)和历史案例的数据,在阿里云平台上调用数据分析、文本挖掘以及机器学习/深度学习的技术,从而让机器也具有「智能判案」的本领,既能解决法官的时间,又保证了案件审理的公正、透明。

特点四:新技术带来的人机协同

人与机器的关系是自工业革命以来长期困扰人类社会的问题,人工智能的到来更加剧了这类担忧。但从技术发展的现状而言,尽管语音、图像、自然语言处理发展速度奇快,但这些技术所形成的所谓「智能」,与人类「智能」又本质差异。包括深度学习「教父」级别的 Hinton 也表示无需过度担忧这个问题。

透过语音落地300家法院这扇窗,一窥阿里云「产业 AI」的四大特点

我们更应该思考,则是如何实现新一代人机协同,即充分发挥人与机器在不同领域的优势,实现优势互补。

今年的双十一购物节中,阿里巴巴就展现了人机协同的新模式,从机器智能推荐系统、客服机器人「阿里小蜜」、AI设计师「鲁班」、机房运维机器人「天巡」,它们与人类员工一起完成各项任务,其结果就是,在不增加人力成本的前提下创造了又一个商业奇迹,同时也是「有史以来最大规模的人机协同」。

在司法领域,法庭庭审记录过往都是速记员记录,书记员审核并做摘要,而在语音识别和自然语言处理的帮助下,从语音识别到摘要生成都实现了自动化、智能化处理;法律行业规则复杂、知识量较多、知识边界模糊,这种记忆、分类的工作完全可以交给机器,结合深度学习的算法,可以让机器越来越「懂法」,成为法官们的重要协作伙伴。

写在最后

正如上文所言,人工智能的各项技术都不是什么新技术。上世纪 50 年代初,美国乔治敦大学就通过对于语言规则的理解,结合自然语言处理技术,推出一款俄语英语翻译机;语音识别的最早出现是在上世纪 70 年代,从声音模型到语言模型,整个语音识别的框架基本形成。

但 60 多年来,一代代的人工智能从业者们却陷入了「为技术而技术」的漩涡里。多少次,那些在实验室里完美无缺的技术一遇到现实问题就像离开河水的小鱼一样瞬间失去魔力,多少次,当政府、大公司开始减少相关投入,人工智能从业者们或失业、或转行,人工智能寒冬(AI winter)甚至成了一个专有名词。

如今,人工智能在经历了 2016、17 的疯狂炒作之后,也走到了一个十字路口。放眼全球,过去两到三年人工智能所取得的成绩,不过是海量数据、优质算法与计算能力结合后的特定展现,它当然可以用来炫技,也可以用来与人类对战,但历史经验一次次告诉我们,倘若没有将人工智能应用在经济社会的现实挑战里,下一次 AI Winter 并不太遥远。


分享到:


相關文章: