照片閉眼也無妨，Facebook黑科技完美補全大眼睛攝影頭條網

照片閉眼也無妨，Facebook黑科技完美補全大眼睛

現在有很多方法可以美化照片，讓你看起來更好看，簡單的，比如消除紅眼或者鏡頭眩光，複雜的，甚至可能讓你看起來變了一個人。

但是，到目前為止，還沒有一個很好的辦法處理照相時眨眼的問題：當拍照的那一瞬間眼睛正好閉上了，那麼……就只能重新拍一張。

不過，現在好了，Facebook的一項最新研究可以很好地解決這個問題，而且效果驚豔。

深度學習讓計算機“腦補”，風格轉移合成逼真細節

Facebook在他們發表於CVPR 2018的論文“Eye In-Painting with Exemplar Generative Adversarial Networks”中描述了這項工作。

這裡提到的“In-Painting”，也即圖像補全，最初是一個傳統圖形學的問題，在一幅圖像上挖一個洞，看如何利用其他的信息將這個洞補全，並且讓人眼無法辨別。

這個問題對人類來說似乎很容易，只要稍微想象一下，大家很容易就能腦補出洞裡應該有什麼。但是，這個任務對於計算機而言卻十分困難，因為這個問題沒有唯一確定的解，如何利用其他的信息，如何判斷補全的結果是否足夠逼真，都是要考慮的問題。

近來，深度學習的發展，得益於神經網絡對圖像中高層特徵（high-level feature）的提取能力，研究人員可以將大數據和high-level feature組合起來，使這個十分困難的問題得到了比較好的解決。

例如，2017年，來自伯克利和Adobe等機構的研究人員提出了一種混合優化方法（joint optimization），利用編碼器 - 解碼器CNN的結構化預測和神經補丁的力量，成功合成了實際的高頻細節。

對於給定的一張帶有孔洞（256×256）的圖像（512×512），算法可以合成出更清晰連貫的孔洞內容（d）。上圖展示了混合優化方法與用Context Encoders（b）、PatchMatch（c）這兩種方法產生的結果的比較。

類似於風格轉移（style transfer），他們的方法將編碼器-解碼器預測作為全局內容約束，並且將孔洞和已知區域之間的局部神經補丁相似性作為風格（style）約束。

補全眼睛，還是個大問題

但是，上述方法還是存在種種侷限，其中之一就是對眼睛的補完。

這並不是說眼睛——“人類心靈的窗口”很難模擬。實際上，目前的深度網絡已經能在語義上產生逼真的、令人信服的結果。

但是，大多數方法並不能保留照片中人物的“身份”（identity）。DNN可以學習“打開”一雙閉合的眼睛，但是模型本身並不能保證新的眼睛對應於這個人的特定眼睛結構。

DNN只會插入一雙與訓練集中相似的臉相對應的眼睛。這時候，如果一個人有一些明顯的特徵，比如眼睛的形狀比較特別，就不會在生成的部分中得到體現。

Facebook提出ExGAN，比cGAN更具表現力

Facebook作為全球最大的社交網絡，每天乃至每一分鐘都有大量用戶將自己的照片上傳，而其中就有很多是閉眼的照片。

坐擁可能是全球最大的閉眼照片數據集，Facebook的研究人員自然會想，能不能在這個基礎上做些什麼。

於是，有鑑於生成對抗網絡（GAN）在生成逼真圖像中的應用，Facebook的Brian Dolhansky和Cristian Canton Ferrer提出了一個Exemplar GANs （ExGANs）。

ExGAN是條件GAN（cGAN）的擴展，利用示例信息，生成高質量、個性化的圖像補全。

與以前的條件GAN不同，在判別器網絡裡插入了額外的參考信息（參考圖片或者感知代碼），因此ExGAN有更強的表現力。

ExGANs的總體訓練流程可以概括為：

從輸入圖像中標出眼睛;
以參考圖像（reference image）或感知代碼（perceptual code）為指導，對圖像進行補全;
通過輸入圖像和補全圖像之間的內容/重構損失，計算生成器參數的梯度;
用補全圖像、另一個ground truth圖像和參考圖像或感知代碼，計算鑑別器參數的梯度;
通過生成器反向傳播鑑別器的誤差。還有可選的一步，用感知損失對生成器的參數進行更新。其中，函數C（I）是身份函數。

ExGAN，讓閉眼照片完美“開眼”

ExGAN從樣例中，不僅瞭解了這個人的眼睛看的是什麼，還了解了這個人的眼睛的結構、瞳孔的顏色，等等。最終補全的結果非常逼真而且自然。

在測試中，人們誤把假眼睛睜開的照片當成真實的，或者有超過一半的時間他們不能確定哪個是哪個。看了上面的實例，除非我知道照片肯定是被篡改過的，不然我在信息流中滾動瀏覽時我可能根本就不會注意到。

在下圖中，左邊第一列是ground truth，第二列是其他方法，第三列和第四列都是ExGANs的結果。其中，第三列是使用了參考圖像的結果，第四列是使用了感知代碼的結果。（圖片可以點擊放大查看。）

在某些情況下，ExGANs仍然會失敗，比如當一個人的眼睛被一縷頭髮遮住了一部分，或者有時不能正確地著色，就會產生一些奇怪的人工痕跡。但這些都是可以解決的問題。

研究者表示，Exemplar GANs是一個通用的框架，因此可以拓展到其他計算機視覺任務乃至其他領域的問題上。

在這次的研究中，基於參考圖片和基於感知代碼的兩種方法是分開的，因為他們想展示這兩種方法都是可行的。未來，他們會研究將這兩種方法結合在一起，比如在生成器裡使用參考圖片，在判別器裡使用感知代碼，從而生成更加逼真可信的眼睛補全。

不論如何，我們的照片將變得更加自然和漂亮，而鑑別“換臉”或者假視頻的任務，也將更具挑戰。

分享到:

閱讀更多 科技大爆冷 的文章

關鍵字: 照片社交網絡 Facebook

照片閉眼也無妨，Facebook黑科技完美補全大眼睛

相關文章:

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

婚前男方擁有個人房產，婚後將這房產賣出用這房產的錢來買房，怎麼算個人財產？

男方出首付，婚後一起還房貸，房產證名字怎麼寫？

女兒離婚，婆家有3套房產，但都是婚前財產，父母應該怎麼樣為女兒爭取利益？

三星低端A40S以及中高端A80值得購買嗎？

如何看待今年高考報考人數超過一千萬人？

97分！利物浦成五大聯賽最高分亞軍，與衛冕冠軍曼城只有“一分之差”，是不是太苦了？

榮耀20值得等待嗎？還是入手榮耀v20？謝謝？

曼聯0-2卡迪夫，博格巴謝場時遭球迷辱罵，其豎大拇指+雙手合十回應，你怎麼評價？

泰迪一定要吃狗糧嗎？

銀行職員將存款500元打成500萬元，儲戶把錢用完了需要擔法律責任嗎？為什麼？

拉布拉多和金毛犬養哪一個比較好？

貝爾本賽季表現並不差，為什麼會遭齊祖徹底放棄？

在取款機裡取到假幣該怎麼辦？

如果有張（J036519610）紙幣，能否認定年號鈔嗎？聽聽大家的看法？

2019版人民幣將要發行，那麼99版和05版現在值得去收藏嗎？

不流通的舊人民幣值多少錢，該如何處理？

第四套人民幣豹子號值錢嗎？

第四套人民幣豹子號值錢嗎？

怎麼分辨902綠幽靈？

EXCEL如何把數值批量轉換成文本？

閬中古城離廣元市多遠？

宜賓：情感糾紛女子背幼子欲跳橋，路過民警救下, 你怎麼看？

Excel中，有哪些激動人心的功能？

Word有什麼技巧是讓你相見恨晚的？

excel中的數據有效性怎麼用？

excel中如何設置excel表格到期後不能使用？

未來5G微基站能否嫁接到路由器上走光纖，解決室內信號弱網速慢的老毛病？

700MHz為何被認為是5G的黃金頻段？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？