遠程會議讓我無心工作,讓AI替我去開會吧

機器之心報道

參與:澤南、蛋醬

對於國內外不少人來說,現在已經是 Zoom 時代了,我們整天都生活在其中無法自拔。

不管你喜不喜歡,新冠疫情期間,人們都得使用遠程辦公平臺開視頻會議。就算是飽受批評,視頻會議平臺 Zoom 也在最近一段時間業務量有了爆炸性增長。

不過對於一些有些靦腆(家裡東西擺得比較亂)的人來說,使用視頻會議軟件,讓攝像頭對著自己拍攝老半天總覺得有點彆扭。更何況你總得整理好儀容,穿上正式一點的上衣什麼的。

遠程會議讓我無心工作,讓AI替我去開會吧

有沒有辦法避免這種尷尬呢?

最近,美國一家名為 Redpepper 的創業公司裡,工程師 Matt Reed 找到了使用 AI 技術創造虛擬形象的方法。用 AI 模擬自己的形象,代替自己參會,並與他人進行交流,看起來是個完美的解決方案

「我參加 Zoom 會議的數量已經突破了大氣層,衝上了火星,」Reed 在自己的博客中寫到。「這讓我幾乎沒有精神放鬆的時間,刷刷 Reddit,或者真正地完成工作。如果 Zoom 是電影《頭號玩家》裡的虛擬現實環境 Oasis——每個人都整天泡在裡面。」

他為自己設計的虛擬形象非常有針對性,名為 Zoombot。其使用目前流行的基於深度學習的算法,以及文本轉語音工具,其模型可以在會議中實際對其他人的交流活動做出反應。有趣的是,Reed 並不只是說說而已,他的 Zoombot 虛擬形象登上公司內部會議前甚至都沒有和自己同事說一聲,讓我們看看他們的反應吧:

00:00/00:00倍速

這位仁兄還把自己構建虛擬人的方法寫在了 GitHub 上,希望能為大家「造福」:https://github.com/mcreed/zoombot

看起來只是用 js 接口做的一個小程序,你只要把自己的照片替換掉 Reed 的照片,然後將其搭建在自己的服務器上即可

最初,Reed 是受到一條推特的啟發:「世界如此美好,我卻因為 Zoom 畫地為牢。」他突然產生了一個大膽的想法,為什麼不製作做一個虛擬的自己呢?讓這位「孿生兄弟」替我開會。

這個夢想,你我都曾經有過,假如有個和自己一模一樣的機器人,那它就可以替我上學和寫作業了,豈不美哉。

Reed 盤算了一下,雖然使用虛擬人物去開會也有暴露的可能,但理想狀態下,從會議開始的「Hello」到會議結束的「Bye」,很可能都不會有人注意到自己。

而且,這個操作也並沒有什麼難度。首先,你要把/ img 中的圖像替換成自己的照片,然後把這些文件放在運行 https://的服務器上,否則 Chrome 會引發安全錯誤,也會無法訪問麥克風。

最關鍵的一步是如何營造互動感。Reed 使用 Artyom.js 進行了語音互動設置,這是一個語音識別和文本轉語音的庫,可以用來接收你的領導或者同事所說的話,然後還能自動說出你所編寫的內容,打造一種「愉快」的會議互動氛圍。

這個庫的優點在於,不像 Alexa 或 Siri,必須要喚醒詞才能使用。它只需要聽到「How are you」、「Are you OK」或者「你能發送一下嗎」,就會觸發命令,比如循環臉部靜止圖像並說出回覆。

Artyom.js 項目地址:https://github.com/sdkcarlos/artyom.js/

隨後,在 Chrome 中訪問 Zoombot https:// URL,使用左上方的按鈕打開 Zoombot,它開始收聽所有這些關鍵詞。最後,將 Zoom 的攝像頭設置為「ManyCam 虛擬網絡攝像頭」,並打開揚聲器,與 Zoombot 交談。

遠程會議讓我無心工作,讓AI替我去開會吧

如此一來,你就可以化身一個沒有感情的開會機器了。

「How are you?」——「我很感謝您的問候。」

「你明白了嗎?」——「我沒聽清你在說什麼。」

「再見!」——「稍後再聊。」

遠程會議讓我無心工作,讓AI替我去開會吧

在同事們明白 Reed 在搞什麼鬼之後,大家都忍俊不禁。「這就是最有趣的地方,」Reed 說道。「但我必須在事情變得無法收拾之前提前切斷會議,因為 Zoombot 有可能無限循環『讓我們回到上一個』或者『我聽不清,你能重複一遍嗎』這樣無意義的對話狀態。不過這足以引發所有人爆笑了。」

要說讓一張照片按照你想要的方式「動起來」,在 AI 領域裡還真不是什麼無法實現的事。去年 5 月三星發表的一篇 CVPR 2019 論文就介紹了能讓《蒙娜麗莎》動起來說話的 AI 模型。研究人員只用少量甚至一張圖像或畫作就合成了人物開口說話狀態的頭部動畫。

想要做到這樣的效果,我們需要利用 Few-shot learning 等技術,合成頭部圖像和麵部 landmark。由算法創建的數字替身此前也被用於創建 deepfake 圖像和視頻。

遠程會議讓我無心工作,讓AI替我去開會吧

CVPR 2019 論文:Few-Shot Adversarial Learning of Realistic Neural Talking Head Models 呈現的效果。

效果不錯?看到這裡,你是不是也想搭建自己的 Zoombot 了?不過在這之後,記得向大家說一聲,要是來真的,很可能就被放入下一季度優化名單了。

背後的技術:https://github.com/alievk/avatarify

參考內容:https://musebycl.io/index.php/makers/agency-guy-built-ai-clone-attend-zoom-meetings-him


分享到:


相關文章: