小米AI相機2.0大揭祕

IT之家5月2日消息 小米此前已發佈了包括小米10/Pro以及小米10青春版手機,除了硬件配置升級外其AI相機也升級到了2.0版本。今日小米官方也發文詳細科普了全新的小米AI相機2.0。

IT之家瞭解到,小米相機算法團隊將傳統的場景感知拓展成為全方位的色彩、對比度、光影等內容感知,同時小米的相機團隊還使用了深度神經網絡對整個畫面進行全局和局部的分析以獲取最優的畫面效果,並且實時地對畫質進行增強。新一代的AI相機能夠對所有的場景進行有針對性的畫質提升,即識別+處理合二為一。

(1)數據生成

小米相機團隊除了和設計師合作PS了數萬張手機拍張數據之外還收集了很多網絡上的高分圖片作為目標,同時其還使用了two path GAN網絡進行訓練,能夠保證生成網絡生成的圖片跟原圖片的內容保持一致,僅僅去優化一些團隊希望對原圖進行優化的維度。

小米AI相機2.0大揭秘

Two Path GAN示意圖

(2)訓練過程

在訓練的過程中小米相機團隊通過consistency loss,similarity loss,total variance loss ,adversarial loss等不同的weight 來控制生成網絡的優化方向和能力。

訓練過程(訓練機制、幀間一致性處理、開關模塊):

> Teacher - student 機制:

生成器網絡訓練結束後,以生成器網絡作為teacher 網絡,一個更輕量級的網絡作為student 網絡進行學習。小米相機團隊在輕量級的網絡中加入了自相似圖(self-similarity map)作為guidance map來實現相似結構和區域的效果儘量一致。

小米AI相機2.0大揭秘

Teacher-Student網絡

> 幀間效果一致性:

由於每幀都會做處理,幀間效果需要穩定,否則在視頻和預覽的時候就會容易出現跳變。但是上述的訓練是在圖片上做的,因此,在訓練student網絡的時候我們添加了幀間相似度loss,以保證幀間的效果一致。

小米AI相機2.0大揭秘

幀間相似度Loss

> 開關module:

小米相機團隊在訓練的過程中加入了switch module,這個模塊的作用就是能夠通過判斷不同的景物來選擇不同的效果,有效的實現了針對不同的場景做不同的處理的效果。

小米AI相機2.0大揭秘

Switch module

(3)處理速度

在實現AI算法2.0中,團隊除了使用常見的網絡減枝,網絡壓縮的技術外還提出了一種新的基於導向圖的開關網絡結。這個網絡不僅僅可以使得網絡參數和計算量大幅下降,也可以滿足優化的多樣性要求(噪聲,亮度,顏色,對比度,高動態等等),最終得以將全新的AI相機展現給用戶。

小米AI相機2.0大揭秘

基於導向圖的開關網絡結構


分享到:


相關文章: