阿里安全圖靈實驗室再次刷新世界頂級算法比賽成績

近日,阿里安全圖靈實驗室(Alibaba Turing Lab)在Pascal VOC挑戰賽(Pattern Analysis, Statical Modeling and Computational Learning)的目標檢測(Object Detection)之Competition 3 :TRAIN ON PASCAL VOC DATA項目中獲得了74.8分,刷新了該項檢測的世界最好成績。(成績查詢網址:http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?cls=mean&challengeid=11&compid=3&submid=16634#KEY_ATLSSD)

阿里安全圖靈實驗室再次刷新世界頂級算法比賽成績

據悉,PASCAL VOC挑戰賽是視覺對象的分類識別和檢測的一個基準測試,提供了檢測算法和學習性能的標準圖像註釋數據集和標準的評估系統。在計算視覺領域,Pascal VOC挑戰賽類似於數學中的哥德巴赫猜想,與ImageNet和COCO(Common Objects in Context)同為世界頂級的比賽。

PASCAL VOC的圖片集包括20個目錄:人類,動物(鳥、貓、牛、狗、馬、羊),交通工具(飛機、自行車、船、公共汽車、小轎車、摩托車、火車),室內(瓶子、椅子、餐桌、盆栽植物、沙發、電視)。其數據集圖像質量好,標註完備,非常適合用來測試算法性能,是深度學習圖像領域算法性能檢驗的“標準”數據集。

阿里安全圖靈實驗室研究人員表示,PASCAL VOC擁有全球最為權威、通用的數據集之一,同時也極具挑戰性。為此,他們研發了ATLSSD算法(Alibaba Turing Lab Single Shot Multibox Detection)。該算法基於one-shot的檢測框架SSD,兼顧模型性能和效率,並在多尺度特徵抽取層增加了層間連接,類似FPN(Feature Pyramid Network)結構;在Extra Network增加了RFB(Receptive Field Block)結構,增加特徵層對於不同尺度、不同形態目標的表徵能力;訓練過程中模型利用Hard Negative Mining進行模型預熱,然後利用Focal Loss進行finetune,使得在有限的數據下,通過learning from scratch達到較好的訓練效果。

目前,圖靈實驗室的算法模型已廣泛應用於阿里生態的淘寶、支付寶、優酷、UC等核心業務線,比如商品中的違禁內容、假貨和視頻的智能化防控等,並通過阿里雲上的產品和解決方案(例如內容安全、實人認證等)為各企事業客戶提供優質的AI服務。

“為了讓算法更貼近業務,解決更為實際的問題。我們曾經推出過智能食堂項目,自主研發的刷菜圖像算法實現了菜品的智能識別和支付結算,並藉助物聯網裝置,在雲端記錄了用戶每日每餐的食物成分。”阿里安全圖靈實驗室的研究人員表示,“我們在人工智能領域的研究為阿里經濟體的智能化發展提供了強大的驅動力的同時,也為數億用戶創造了極致的體驗。”

據瞭解,圖靈實驗室是阿里安全的頂級人工智能研發團隊,專注於計算機視覺、自然語言處理、機器學習和深度學習等領域的技術研發,已先後申請了50多項專利,並多次在國際權威評測中刷新世界紀錄(今年3月,在ICDAR2017 Competition on Multi-lingual scene text detection(MLT)自然場景多語言文本檢測競賽中就已經刷新了世界最佳成績),其成員多為清華、北大、浙大、中科院等的博士或碩士。


分享到:


相關文章: