人臉識別的新世界——卡通人臉檢測

人脸识别的新世界——卡通人脸检测

整理編譯:T.R

人臉識別作為深度學習最具代表性的技術之一,近年來得到了飛速的發展,無論是在精度、速度和規模上都有了極大的提高。在取得如此巨大成功的同時,科學家們將目光轉向了一個尚未充分探索的領域——卡通人臉識別,即將卡通動畫作品中的人臉進行準確的檢測和識別。

隨著數字技術和新媒體技術的快速發展我們的生活中出現了越來越多的卡通化人物,它們不僅成為了孩子們認識世界的窗口,更提供了教學輔助和科研傳播的功能,甚至用於描述個人觀點甚至傳播社會思想。與標準的繪畫作品相比,卡通、漫畫、幽默作品以一種十分誇張的方式來表現,並導致了人臉的大幅形變和特徵轉移。對於卡通人臉的檢測在動畫行業中的需求也日漸增加,主要包括:通過圖像搜索引擎在網絡中搜索相似的卡通圖像;通過識別和語音合成幫助視覺障礙認識享受卡通電影的樂趣;同時還能作為內容控制和審查軟件的一部分來對社交媒體的內容進行處理。

為了實現這一目標,研究人員們利用了IIIT-CFW卡通數據集作為燃料,基於深度學習實現了卡通人臉檢測、識別工作,並超過了傳統的方法達到了優秀的檢測效果。

人脸识别的新世界——卡通人脸检测

這一數據集中包含了8928張帶標記的卡通人臉圖像,其中不僅包含了不同年齡、性別、情感的基本人臉數據,同時還包括各個人種、人臉位置以及諷刺隱喻等高維度信息,其標註信息示例如下,包括了七個特徵維度和包括角色名字的五個人臉位置維度信息:

人脸识别的新世界——卡通人脸检测

Face Annotation

作者對於卡通人臉主要進行了三個方面的工作:人臉檢測、人臉識別和性別檢測,並在檢測的過程中對卡通人臉的關鍵點進行了識別和抽取。

對於人臉檢測,研究人員們主要使用了MTCNN(Multi-task Cascaded Convolutional Network)網絡,這一架構包含三個主要的部分分別是通過圖像金字塔提出候選框的建議網絡P-Net、隨後是用於提煉優化結果的精煉網絡R-Net,最後是用於生成最終人臉框和五個標誌結果的輸出網絡O-Net。

人脸识别的新世界——卡通人脸检测

對於人臉識別工作,研究人員們提出兩種方式,第一種是利用Inceptionv3+SVM來進行識別,首先利用Inception來高效抽取圖像特徵,並在最後使用分類器來對最終2048維結果進行分類實現識別。

人脸识别的新世界——卡通人脸检测

另一種方式利用了建議系統來構建了標誌抽取系統,並基於多輸入多輸出的CNN分類器實現了人臉識別。首先將卡通圖像進行灰度和歸一化處理,隨後對卡通人臉圖像的15個特徵點座標進行抽取。在檢測過程中,使用了5層的神經網絡對特徵點進行檢測(利用真實的人臉進行了訓練,以提高人臉特徵檢測能力)。最後這一結果和像素處理的結果同時送入到建議人臉識別架構網絡中去,通過CNN的多輸入多輸出結果進行識別。

人脸识别的新世界——卡通人脸检测

通過對於上述網絡的訓練後,得到了良好的檢測結果。在人臉檢測的表現上,作者同時和基於HOG特徵及Harr特徵的結果進行了比較,在真陽性、假陽性、假陰性的指標都超過了這些方法。

人脸识别的新世界——卡通人脸检测人脸识别的新世界——卡通人脸检测

在卡通人臉關鍵點提取任務中也表現良好。

人脸识别的新世界——卡通人脸检测

這一工作的主要貢獻在於利用MTCNN架構實現了卡通人臉的檢測,並在多個指標上有了較大的提高,同時在卡通人臉識別任務上利用了預訓練的Inception架構和SVM特徵分類器實現了更高的效果。並提出了基於LeNet的多輸入多輸出HCNN架構降低了top5的錯誤率。

值得一提的是,在卡通圖像領域還有很多的工作可以去填坑,包括卡通人臉識別、驗證、性別識別,照片到卡通圖像的相互轉換(類似風格遷移)、卡通人臉檢測、位置估計和關鍵點檢測、相關特性識別以及基於卡通圖像特徵的搜索引擎。同時還包括通過照片轉化為一系列卡通表情的生成、草圖繪製和渲染,以及相應的逆問題。還有很多應用和點可以再卡通領域進行探索,甚至GANs和VAE也是一個不錯的選擇呢!

如果你想上手嘗試下你喜歡的二次元角色的話,可以參考下面的資料:

  • 一個曾經的demo:https://github.com/nagadomi/animeface-2009

  • paper:https://arxiv.org/pdf/1804.01753.pdf

  • database:https://link.springer.com/chapter/10.1007/978-3-319-46604-0_3

  • 還有一些其他的人臉database:http://web.mit.edu/emeyers/www/face_databases.html

-The End-

將門是一家專注於發掘、加速並投資技術創新激活商業價值的創業公司的創投機構,旗下設有將門創新服務、將門技術社群以及將門投資基金。

將門創新服務專注於使創新的技術落地於真正的應用場景,激活和實現全新的商業價值,服務於行業領先企業和技術創新型創業公司。

將門技術社群專注於幫助技術創新型的創業公司提供來自產、學、研、創領域的核心技術專家的技術分享和學習內容,使創新成為持續的核心競爭力。

將門投資基金專注於投資通過技術創新激活商業場景,實現商業價值的初創企業,關注技術領域包括機器智能、物聯網、自然人機交互、企業計算。在兩年的時間裡,將門投資基金已經投資了包括量化派、碼隆科技、禾賽科技、偉景智能、Convertlab、迪英加科技等十幾傢俱有高成長潛力的技術型創業公司。

如果您是技術領域的初創企業,不僅想獲得投資,還希望獲得一系列持續性、有價值的投後服務,歡迎發送或者推薦項目給我“門”: [email protected]

將門2018招聘看這裡!

企業戰略合作、新媒體運營、技術專家、行業專家等多個崗位期待您的加入~

也歡迎您轉給身邊優秀的朋友!推薦成功、一經錄用將獲得

15000元現金作為答謝!

人脸识别的新世界——卡通人脸检测

點擊右上角,把文章朋友圈

將門創投

讓創新獲得認可!

[email protected]


分享到:


相關文章: