史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

"

随着越来越多的AI人才走入行业,我们期待有更多成熟的技术落地,推动各行各业的自动化和智能化升级。

来源:智东西(ID:zhidxcom)

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

今天(8月21日),第24届国际模式识别大会(ICPR)在北京开幕。今年大会共收到1258篇论文,最终有125篇论文被选作口头报告,527篇论文被选作海报展示,总体入选率达52%,属于近几届ICPR较低的入选率。其中,中国有超过100家高校及研究机构的论文被接收,入选口头报告的有60篇,入选海报展示的论文数量达300篇。

在中国企业中,阿里巴巴、京东方、平安科技各有一篇论文入选口头报告,三星中国R&D研究院、北京麦哲科技、京东金融、众安科技、深圳中科微光和阿里巴巴各有1篇论文作为海报展示。

夸张一点来说,我国高校和企业的入选论文占了总入选论文的半壁江山。

情感识别专家摘得大奖桂冠

此次,我们观看了模式识别最高荣誉King Sun Fu Prize(傅京孙奖)颁奖活动。这是一个颁给对研究人员的终身成就奖,用于鼓励获奖者在模式识别领域的杰出技术成就。该奖项每两年颁发一次,提名者必须由IAPR成员提名,并至少得到五名成员的认可,且IAPR执行委员会和奖项委员会成员不具备获奖资格。

今年的获奖者是芬兰奥卢大学教授Matti Pietikainen,他在局部二值模式(LBP)纹理分析、人脸图像分析等方面做出了许多开创性的贡献,他发表了300多篇学术论文,在谷歌学术上的引用次数总计超过5万次。2011年,他因为在机器学习视觉纹理和人脸分析方面的贡献而被任命为IEEE Fellow。

随后,Matti Pietikainen发表了主题演讲,分享了其研究团队在人脸分析与情感AI方面的一系列研究成果,包括情感与动态人脸表情识别、基于局部二进制(LBP)算法的图像和视频描述、心率测量、可视语音识别和多模态情感分析等内容。

除了介绍相关算法外,Matti Pietikainen还展示了这些研究的一些应用场景,并分享了几个有趣的实例视频。比如机器可以在川普和希拉里的竞选视频中根据两人的动态表情变化实时分析出他们在那一刻的心情。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

此外,面部表情分析还可以应用到情感机器人、顾客体验分析、在线教育、疼痛强度预估、审讯、价格谈判、心房颤动等多个行业场景。

Matti Pietikainen表示,目前情感AI领域的研究仍然处于初级阶段,未来挑战的研究方向有卷积神经网络二值化(Binarized CNNs)、常规算法和卷积神经网络混合等。

对于产业界而言,情绪识别还是一个非常新的领域,目前在这方面投入关注的企业不算太多,已经做出具体产品企业的包括旷视、竹间智能、微软小冰等。

图文识别大面积落地开花

昨天,MTWI(Multi-Type Web Images,多样式网络图像)识别挑战赛在会上举办,中科院、清华、北大、三星中国研究院、科大讯飞、商汤科技、网易等学术界和产业界的研究机构纷纷参与了这次比赛。

MTWI识别挑战赛一共分为三个任务,每个任务的参赛队伍数量分别为70、193、26支。三个任务如下:

(1)网络图像文本行识别(Text Line Recognition of Web Images),要求识别出给定文本行中的文字;

(2)网络图像文本检测(Text Detection of Web Images),要求检测出文本行所在位置;

(3)网络图像端到端文本监测和识别(End-to-End Text Detection and Recognition),要求同时对文本行进行监测和识别。

该挑战赛使用华南理工大学和阿里巴巴联合收集的已标注图像作为MTWI数据集,训练集和测试集各有10000张图像。每支队伍有三次机会提交测试结果,最终结果按每支队伍的最优成绩加以排名。最终,科大讯飞和中科大语音及语言国家工程实验室联合团队的成绩相当亮眼,在三项任务全部夺魁。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

虽说是学术会议,本届大会依然吸引了不少企业前来参展, 在大会的展区,我们也看到科大讯飞、百度、阿里巴巴等国内企业的身影。

图片是互联网时代传递信息的重要媒介,每天都有亿兆级别的图像在流动传播,图片中的文字识别(OCR)有重要商用价值。除了昨日挑战赛拿了三项冠军的科大讯飞外,阿里巴巴和百度也各自展示了其在图像文字识别领域的产品。

阿里巴巴“图像和美”团队打造的OCR云产品,能够实现快速高效率的图像文字定位、识别和理解。展位工作人员现场展示了“钉钉”APP中的“传图识字”功能,对现场随便拍一张照,手机可以立即识别出其中包含的文字。除了现场拍照,“传图识字”还提供方便的卡证照识别服务,比如它能直接识别并整理发票图片中的内容。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

除了人脸识别,

“AI+安防”还有很多可能

在展区的另一侧,有几家主营AI+安防业务的企业展位,它们都是从中科院自动化智能感知于计算研究中心孵化。有趣的是,在人脸识别几乎成为“AI+安防”主旋律的大背景下,这几家公司的主攻方向都在于补上人脸识别应用于安防领域容易出现的漏洞。

人脸识别往往需要足够高清的摄像头和较近的拍摄距离,但当遮挡、光线等变数出现时,人脸识别往往不再适用。银河水滴的主营业务就是补上这一缺口,他们主要做步态识别的软硬件及解决方案,能够通过对人进行远距离的跨视角步态识别,其精确度高达94.1%。此外,银河水滴还打造了全球最大容量的步态数据库。

做虹膜识别业务的中科虹霸和中科虹星则是一对同门兄弟,他们的创始人员都源自中科院自动化所的虹膜识别研究团队。不过,两家公司的主攻方向却有所不同。中科虹霸主要在做近距离虹膜识别的产品,展位工作人员向智东西展示了他们的可以存放20000人虹膜信息的身份验证成机,用户在距离机器大致60cm的位置录入虹膜,随后即可通过虹膜识别判断身份。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

中科虹星的产品则主攻远距离虹膜识别。其工作人员展示的身份验证机器的用法和上述提及的中科虹霸产品相似,不同的是,它将验证距离扩大到1.2m,并可以根据客户的需求对验证距离进行相应的调整。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革

模式识别技术落地广泛,

学术进步引领产业变革

近年来,AI发展非常迅速,大部分最新研究成果都会先发表在顶级会议上。作为产学研的基础,AI学术研究的成果可能会引发未来几年新的行业变革。

本次主办ICPR大会,对于我国在国际AI学术领域而言,绝对是值得庆贺的进展。从主办权到参与度,从论文数量到科研成果,我国高校、科研机构和企业正在不断刷新记录,我国在AI领域的影响力与日俱增。

在本次大会上,我们还看到许多高校的硕士和博士生穿梭于各报告厅之间。我们也惊喜地发现,许多研究团队正在和企业合作,这意味着我国学术人才正在走出象牙塔。

随着越来越多的AI人才走入行业,我们期待有更多成熟的技术落地,推动各行各业的自动化和智能化升级。

史上最“中国”的AI学术大会!讯飞秒掉全球对手,情感识别大热|学术进步正在引领产业变革


分享到:


相關文章: