愛奇藝舉辦AI競賽搶佔“多模態視頻人物識別”賽道制高點科技頭條網

愛奇藝舉辦AI競賽搶佔“多模態視頻人物識別”賽道制高點

為了推動人物識別在視頻智能分析產業中的廣泛應用，愛奇藝聯合中國模式識別與計算機視覺大會（PRCV2018）共同發起“多模態視頻人物識別挑戰賽”。近日該賽事公佈了最終結果： InfiniVision&帝國理工學院iBUG（DeepInsight）團隊、百度VAR團隊、以及周同科技與北京工業大學組成的團隊分獲前三名。此次獲獎的三支團隊通過不同的算法，提升了人物識別技術的精準度。在人臉識別領域具備國際領先水平，曾在MegaFace2018百萬人臉識別領域比賽中獲得第一名的 InfiniVision&帝國理工學院iBUG（DeepInsight）團隊以MAP平均精度均值88.65%的優異成績在本次比賽中再次折桂。賽後，愛奇藝在此基礎上成功利用頭部、聲音、人體等多模態特徵融合信息和更少的模型，進一步將精準度提高了0.8%，在視頻人物身份識別技術上取得了重要突破。此次競賽的頒獎儀式將在11月23日中國模式識別與計算機視覺大會2018（PRCV2018）上進行。

基於人臉、聲紋、姿態、場景等多模態特徵的人物識別技術屬於AI領域中前沿的技術。目前在人臉識別領域最熱門的評測競賽包括LFW與MegaFace，前者側重於對比兩張人臉照片是否具有相同身份，後者則是以在海量註冊人臉中檢索特定人臉的準確率為重要指標。而此次愛奇藝推出“多模態視頻人物識別挑戰賽”則是側重基於人物的聲音、體態、著裝、行為舉止等多維度進行綜合識別，更接近真實場景的需求，難度更大。為此，愛奇藝向全球的參賽團隊開放了目前全球最大的明星視頻數據集（iQIYI-VID），其中包含5000位明星藝人，以及長達1000小時、50萬條視頻片段。此舉吸引了包括紐約大學、瑞典隆德大學、新加坡國立大學、東京工業大學、百度公司、小米公司、微軟等全球頂尖高校以及行業領先的公司組成的397支參賽隊伍參與。

此次獲獎的InfiniVision&帝國理工學院iBUG（DeepInsight）團隊利用one-stage人臉及關鍵點檢測器來進行多姿態人臉檢測和對齊，並且利用ArcFace/Insightface在清洗後的公共數據集上進行訓練, 微調參數獲得了多個人臉識別模型，對特徵融合後獲得的視頻人臉及場景特徵進行MLP網絡的訓練，提升了人物識別技術的精準度與召回率。百度VAR團隊通過對損失函數、訓練流程的改進，以及結合一些非監督的數據清理方式，檢測到低質量的人臉（模糊、側臉），增加了多模態的信息，利用了視頻中場景、行人等信息，使得最後的檢索結果有了進一步的提升。在提升檢測結果方面，周同科技與北京工業大學組成的團隊卻採用了完全不同的方法，他們基於視頻人物人臉特徵、人臉質量、近景遠景視頻場景特徵，挖掘多模態信息間的相關性，構建基於規則分層的多模態融合算法，有效提升了人物搜索的排名。

AI已經成為在線視頻領域的新賽道。基於在這個領域的長期積累，愛奇藝已經將視頻識別技術應用於實際業務中，上線了一系列基於AI技術的產品，人物識別精準度的提升將進一步優化愛奇藝娛樂生態系統的方方面面：愛創媒資系統、藝匯智能選角系統等已經應用於自制內容的製作，將會進一步優化娛樂生態系統的效率；基於智能人物識別的“只看TA”、以圖搜劇等功能可更精確地捕捉視頻畫面，為用戶帶來更為個性化的觀看體驗；智能化廣告點位選取，更在保證用戶體驗的基礎上，最大化廣告主的收益，進而增強愛奇藝的貨幣化能力。

舉辦AI競賽是愛奇藝推動行業技術進步的重要舉措。愛奇藝旨在不斷通過產學研合作，不斷探索前沿技術，實現前沿技術的落地與應用，不斷為用戶帶來極致體驗、優化娛樂生態系統效率以及增強愛奇藝的貨幣化能力。愛奇藝近期發佈的2018年Q3財報顯示，本季度愛奇藝研發費用為人民幣5.584億元（約合8130萬美元），較2017年同期增加63％，目前，各項尖端技術正在應用於更好地提升用戶體驗和製作、分發內容。未來，愛奇藝將不斷通過前沿技術推進娛樂行業的智能化進程。

分享到:

閱讀更多 科技探索號 的文章

關鍵字: 百度愛奇藝人工智能