08.20 商汤科技斩获MegaFace两项第一 已将创新算法应用于产品

近日,国际人脸识别竞赛MegaFace公布了最新榜单,商汤科技分别以99.8%和99.6%的成绩同时在人脸识别(Identification)和人脸验证(Verification)中斩获第一,将人脸识别准确率纪录再次提升。Google、阿里、腾讯等公司AI团队亦参加了此次竞赛。

商汤科技斩获MegaFace两项第一 已将创新算法应用于产品

MegaFace的Identification榜单(部分)

商汤科技斩获MegaFace两项第一 已将创新算法应用于产品

MegaFace的Verification榜单(部分)

MegaFace是由美国华盛顿大学计算机科学与工程实验室发布并维护的一套公开人脸数据集,是一个一百万规模级别的面部识别算法测试基准,资料集共包含690,572个身份共1,027,060张图像。

本文采访了商汤此次挑战MegaFace的钱晨研究团队,一起来了解商汤在竞赛夺冠背后的创新突破。

MegaFace是研究员锻炼发现、定义、分析、解决问题的一次很好实践

Q:商汤在Identification和Verification两项比赛均取得第一的成绩,而且包括谷歌等公司都参加了,从技术的角度来看,商汤在这次MegaFace竞赛中为何能取胜?

A:商汤夺冠有几方面的原因:

(1)技术积累和算法创新。公司内部有很多经验丰富的研究员和大牛,团队会经常与他们讨论最新的算法和Paper,很多算法创新的灵感也都是源自于与他们讨论的结果。

(2)强大的计算力。商汤对于计算集群的投入非常重视。如果没有强大的计算集群,很难能支撑人脸识别算法研发。比如团队最近提交MegaFace的模型,用了128块GPU,用了一星期训练完成,这都得益于商汤的大规模计算集群。另外也得力于训练框架和平台支持,平台组的同事专门为我们开发了一套大规模并行的算法框架,解决了IO、通信等一系列问题,大幅度提升了训练速度。

(3)高质量的人脸识别数据集。刚开始参与MegaFace的时候,团队发现数据集噪音和多样性小的问题对于训练模型非常不友好,性能始终提升不上去。后来团队更换了质量更高的数据库,解决了多样性问题。再加上团队碰撞出一个创新性的人脸识别标注方法,最终在性能上得到了非常大的提升。

(4)团队的凝聚力。参与这些行业竞赛是一个非常锻炼人的事情。在这过程中,每件事都需要人倾心专注的完成,并且互相配合,才能获得最终的性能提升。获得第一并不是一个人的努力,团队成员都非常出色完成各自的分工。

Q:每一个冠军都不容易,想必商汤夺得双冠背后也遇到不少坎坷,可以讲讲这次的总结和感受么?

A:感受其实蛮多的。其一是人员分工。做核心算法研究,团队配置一定要非常合理。团队中要有擅长算法研究的研究员和擅长训练框架开发的研究员,两者互补是最有效的,可以大幅度加快研发速度。

其二是研究方向一定要对,在研发过程中如果有一个非常好的Benchmark指导,非常有利于算法的研发,可以知道算法在哪些方面的改进是有效的,哪些改进是无效的。

最后就是耐性和热情。在这次参与MegaFace的过程中,专攻一个特定领域的算法很枯燥,如果不能保持耐性和热情,很难有所产出。

Q:在算法研发过程中,有时候方向可能会走错,你们遇到这种情况如何及时调整过来?

A:我们建立了一套发现,定义,分析,解决问题的框架,保证算法研发细节不会出现错误。

每次调试新的算法之后,团队都会把Failure Case(故障案例)总结出来,比如人脸识别里面几种比较经典的问题,包括同步姿态的问题、大角度问题、遮挡信息缺失问题、光线变化剧烈问题、年龄问题等;然后将这些问题归类,跟人脸识别经典的问题对应上,并且研究导致这些问题的算法根源;最后是依托现有的工具和学术上的方法指引,深入到算法底层,修改并且完善算法。在这个过程中,经验总结和算法创新至关重要。

MegaFace两项第一的创新算法已经应用于产品

Q:单纯讲技术是不够的,好的技术要应用落地才能凸显价值,这次的创新算法今后有哪些应用场景?从技术研发到产品落地需要经历哪些过程?

A:人脸识别在商汤应用的产品线挺广泛的,比如智慧城市、金融、智能车舱等都有非常广泛的应用。这次MegaFace创新算法也已落地到产品和业务线。

技术研发到产品落地中间有一个重要的一环就是技术红线。团队在人脸识别这块打磨了非常多的技术,当技术接近产品红线的时候,我们先将技术投入到产品中做一些Demo给客户展示。在技术已经达到产品红线时,团队会和工程产品同事一块儿将算法与业务场景结合,针对行业痛点,提出一个创新性的产品。

Q:业界有一些观点认为将AI应用到行业的时候,技术的精确度并不那么重要,对此你们是怎么看的?

A:首先AI的技术需要突破一个业务场景的技术红线,在这之上才能去谈应用。比如智能车舱这个领域,安全方面是非常敏感的,技术红线是非常高的,如果没达到这个技术红线是不敢用的。只有达到这个门槛,才能谈产品化,谈应用。

无监督学习是未来核心研究方向之一

Q:此次挑战MegaFace榜单对研究员的工作有哪些积极意义和价值?

A:MegaFace是一个很好的Benchmark(基准),测试数据集扩充到100万,可以更加放大算法的差距,凸显算法优越性。研发过程中如果有一个非常好的Benchmark指导,非常有利于算法的研发。

Q:团队未来有哪些核心研究方向?

A:目前团队主要在研究无监督的人脸识别问题,这是一个非常吸引人的方向,目前标注数据集需要耗费非常大的人力和物力,成本非常高。但无监督学习只需要少量数据集就可以,可以大幅度节省研发资源,也能大幅度提升性能。


分享到:


相關文章: