AI時代來臨,它能做什麼?

AI時代來臨,它能做什麼?

近些年,隨著AI技術的迅猛發展,人臉識別的認證逐步改變了很多商業交互方式。例如,蘇寧任性貸要求刷臉認證,支付寶提供了基於人臉的驗證登錄手段,很多銀行或者金融公司也提供了遠程的、基於人臉識別的視頻面審流程。

目前,基於AI的人臉識別在精確度上已經超過人類的肉眼辨別能力,很多業務可以便捷地享受AI科技帶來的便捷核驗手段。

不過,直到deepfakes將AI這一大殺器用在了圖像或視頻欺詐上,人們才意識到——深度學習AI技術,用在正向的領域,帶給我們革命性的便捷和高效;用在黑暗的非法領域,給我們帶來的風險可能遠超從前。

Deepfake技術引起轟動,是因為在國外的reddit論壇,一個網名為“deepfakes”的網友在2017年12月發佈了一些利用深度學習技術“修改過”的成人視頻,修改的內容就是將視頻中的人臉照片更換為當前好萊塢最熱的一些女明星的人臉,如2017年大火的神奇女俠——蓋兒·加朵。

AI時代來臨,它能做什麼?

一時間輿論譁然,各社交論壇一致發出公約,不允許此類AI製造視頻的生成和發佈。因為基於深度學習製作的虛假視頻,很容易以假亂真,特別是該技術可能對出鏡頻繁的名人、政客等造成潛在危害,如發佈虛假的聲明、製作虛假的視頻內容等,這將引起極大的社會問題。

2018年初,youtube上有人放出基於Deepfake技術製作的關於川普的模仿視頻:原視頻是 Alec Baldwin 週末晚間秀一段模仿川普的視頻,但是一位youtube的博主 “ derpfakes” 訓練換臉 AI 將 Alec Baldwin 的臉換成了川普的臉。可怕的是,該技術已經能夠達成像素級的人臉識別,展現出了以假亂真、顛倒黑白的潛力。

AI時代來臨,它能做什麼?

不光是視頻,聲音也存在被複制模仿的可能。例如,蒙特利爾初創公司 Lyrebird 開發了一種語音合成技術,用很少的數據,訓練一分鐘,就能複製任何人的聲音。

如果結合上面提到的Deepfake技術,視頻、聲音,加上虛假的內容,未來人們很難識別那些被髮布的新聞消息是否是真實的。同樣,如果你在網絡上留下過多痕跡(照片、視頻、語音),這些信息可能讓你成為AI技術下的受害者。

當AI用在了照片或者視頻欺騙上,未來對視頻的真實性驗證將是一個比較嚴峻的問題。AI圖像研究學者們也注意到這一問題。例如,最近紐約奧爾巴尼大學的呂思偉教授提出的“基於眨眼探測”的技術,用於分析視頻中人物的生理特徵,從而識別出虛假的AI製作視頻。

具體來說,Deepfake算法根據饋送的圖像創建視頻,雖然比較準確,但人工智能始終無法完美再現人類自然產生的所有生理信號。人類通常每兩到三秒就會眨一次眼。而通過照片逐幀合成訓練生成的視頻,會破壞這些正常的生理行為特徵。

為此,呂思偉教授使用CNN(卷積神經網絡)進行人臉中眼睛眨眼的特徵識別。然而,該檢測只能針對單張圖像進行分析處理,而人類的眨眼活動是週期性的,為識別眨眼這一動作,需要再追加一個LSTM(長短期記憶遞歸神經網絡)用於記錄一段時間內的連續性行為。

AI時代來臨,它能做什麼?

在訓練出識別眨眼的模型後,可通過對比正常視頻中的眨眼特徵和derpfake製作的視頻中的眨眼特徵,識別出異常的視頻,其偵測結果如下所示:

AI時代來臨,它能做什麼?

不過,當你以為有這一利器,在反欺詐的視頻檢查上就萬事大吉的時候,那你就錯了!

前面展示的是利用AI進行換臉而造就的虛假視頻。如果造假者在開始就加入了自然的人為特徵,上面的方法可能還需要進一步做優化調整。

例如,H. Kim 等研究人員在SIGGRAPH2018年的論文“Deep Video Portraits”展示的技術,體現了使用一個人的表情特徵來驅動另外一個人的面部,最終生成的視頻,包含著自然的眨眼特徵,其效果如下所示:

AI時代來臨,它能做什麼?

看完效果圖,你會明白:欺詐分子完全可以通過一個表演者,加入人為的自然特徵,來逃過眨眼的檢測。黑產不法分子完全可以通過製作這種映射視頻,再結合虛假的聲音特徵,騙過視頻檢驗的真人核驗,哪怕是面對面的視頻交流,你仍然無法識別其中的真假。

當硬件的計算能力進一步提升,Deepfake技術進一步普及的時候,你是否意識到,你發佈的影像資料、語音資料都可能讓你面臨被該技術侵害的風險?你是否意識到和你面對面視頻的帥哥美女,可能不是你真實看到的實際人物?

互聯網曾經流傳這樣一句話:“電腦那頭,你甚至不知道和你聊天的是不是一條狗”,在未來可能會變成:“即使面對面視頻,你都不知道和你聊天的美女實際是一個摳腳大漢驅動的假人”。

面對這樣的技術應用,你怎麼看呢?歡迎在評論區留言,關注小編,每天都有更新!


分享到:


相關文章: