五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?

郭一璞 發自 凹非寺拍明星後腦勺 報道 | 公眾號 QbitAI

這張毛色豔麗“星空貓”,在經過圖像處理之前長這樣:

沒有了迷幻背景和油畫般的毛色,頓時變成了三隻“凡貓”。

一個不懂GAN也不會PS的普通人,完成這樣的圖像處理要幾分鐘?

在微信通訊錄裡鎖定設計師大神……1分鐘;組織語言求大神幫忙……5分鐘;等大神回覆……30分鐘;大神發來了他的報價……卒。

但是對馬卡龍玩圖的用戶來說,只要點幾下屏幕就夠了。

上傳原圖,APP自動摳出三隻貓;把背景和貓的渲染風格都設置成星空;降低貓的亮度,提高貓的對比度。

三步完成只有設計師才能做出的效果,依靠的是馬卡龍玩圖APP背後的類腦人工智能技術。

一家“沉迷”類腦的AI公司

馬卡龍玩圖APP之前的名字叫Versa,和背後的這家公司的名字一樣。

作為一家專做“P圖”的AI創業公司,Versa的研究方向和別家不同:

不做大數據人工智能,專做類腦人工智能。

Versa的CTO趙維傑向拍明星後腦勺介紹了他們的研究方向和特點。

類腦人工智能和基於大數據的人工智能不同,是機器學習的另一個分支,研究類腦計算,以及概念表示、遷移與生成,和腦科學的關係更近一些。

相比依賴大數據進行模型訓練的神經網絡,類腦人工智能可以實現和人類小孩認識世界類似的能力,僅僅通過少量數據就可以實現一些效果。

比如說,李飛飛2016年的ECCV論文《Perceptual Losses for Real-Time Style Transfer

and Super-Resolution》用到的方法,實現每種風格需要4~8萬張圖片來進行訓練,而Versa的通過類腦人工智能進行風格遷移,每種風格只需要50張圖片就可以了。

△ Gatys和李飛飛的風格遷移效果圖

而概念遷移則是類腦人工智能的另一個優勢。拿圖片來舉栗子,概念遷移是指可以將顏色、形狀等基礎概念,加上語義,拼接成複雜概念。

作為一家以P圖為核心的公司,類腦人工智能便於實現概念遷移的特點也讓Versa在“摳圖”這個步驟中取得了優勢,趙維傑自信滿滿的說他們的準確率超越了谷歌的Deeplab V3+大約5個百分點,達到了95.7%。

△ 摳出人物就可以換背景啦

類腦人工智能的第三個優勢“無中生有”被Versa用在了姿態估計上。

通過單目攝像頭拍攝出的景象,類腦人工智能“腦補”出景深,可以方便實現3D姿態估計。

類腦狂人趙維傑

說趙維傑是個類腦狂人一點也不為過。

目前,趙維傑不僅是Versa的CTO,還是Versa和上海交大的腦科學與人工智能聯合實驗室主任。

早在2012年,趙維傑就已經開始研究類腦人工智能方向了。

在他看來,依靠大數據的人工智能只能解決一小部分問題,比如圖像識別等;而在更廣闊的應用場景中,人們無法獲得如此大量的數據,只能靠類腦人工智能來解決。

而類腦人工智能本身的概念遷移能力,更讓研發的速度足夠快。“任意一個基於腦科學的AI公司,都非常容易建立起長期的技術壁壘,”趙維傑說,“假設說現在我們的圖像分割算法可能領先行業六個月的話,那我們下一個算法一定領先行業要一年。”

這也讓趙維傑找到了自己的創業方向——不是安防、醫療這類基於大數據人工智能的偏B端生意,而是服務更多人、更加多元化的文化產業,通過便捷的圖像處理,讓不管是設計師還是普通人都可以享受到AI帶來的方便和樂趣。

或許,這也是一個AI創業的靈感:誰說底層技術必須服務於B端?

趙維傑告訴拍明星後腦勺,目前Versa在APP端已經擁有1200萬用戶,未來準備繼續在C端通過馬卡龍玩圖APP服務普通用戶,在B端通過Adobe插件的形式,服務專業的設計師,讓設計師們不再花大量時間精力用在簡單的摳圖上。

One More Thing

Versa給拍明星後腦勺展示了馬卡龍玩圖APP下一個版本即將上線的新功能,名叫inpainting,可以一鍵P掉照片裡的人物。

注意“仙人洞”中的那個白衣女子。

不見了。

另外,他們還準備把“摳圖”功能應用在視頻裡,比如把這樣一段電影:

變成這樣:

你覺得效果如何?

最後,讀者朋友們對類腦人工智能怎麼看?歡迎評論區留言。

五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?

五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?

五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?

五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?

五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?

五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?

五十張圖片做出李飛飛數萬張的效果,類腦AI原來這樣玩?


分享到:


相關文章: