終於,有人開發了AI替身,代替自己參加視頻會議

疫情讓遠程辦公成為流行,視頻會議更成為其中一大典型應用。

但過於頻繁的視頻會議,讓一些人產生了奇怪的想法並將其付諸實踐。最近,一位名為 馬特 · 裡德(Matt Reed)的工程師,就成功開發出了代替自己參加 ZOOM 視頻會議的 AI。

乍看之下好像還挺像這麼一回事兒的。

終於,有人開發了AI替身,代替自己參加視頻會議

(來源:馬特 · 裡德)

而且這個視頻會議 AI 不是隻有畫面而已,裡德還為它設計了簡單的語音互動功能,可用以接收你的領導或者同事所說的話,然後還能自動說出你所編寫的內容,打造出和諧的會議互動氛圍。

那麼,這個機器人具體是如何實現的?

為了打造它,裡德首先通過 Quicktime 錄製了自己的視頻圖像,包含幾個常用的視頻會議表情,例如微笑,擺動頭部等。當這些畫面循環播放時,彷彿就是一個克隆版的自己。

然後是配置語音功能。基於 Artyom.js 這一語音識別和文本轉語音的開源庫,他構建了一個自定義 HTML Web 應用程序,可以實現對麥克風傳入的音頻進行語音識別和響應提示。

這個庫的優點在於,不同於 Alexa 或 Siri 必須使用喚醒詞才能說話,它只需要聽到 “How are you”“Are you OK” 之類的命令就能觸發下一步回應,比如循環表情靜止的圖像或者說出回覆。

你可以將裡德該步驟的創作理解為聊天機器人或 Alexa 語音技能。聊天機器人的原理就是經過編程,可以理解某些輸入,並根據這些關鍵字運行命令以給出一些書面響應。但是由於人類語言的自然可變性,聊天機器人和裡德的 Zoombot 還是蠻容易出錯的,畢竟它們都沒有學會人類隨機應變的技能。

終於,有人開發了AI替身,代替自己參加視頻會議

(來源:馬特 · 裡德)

最後,裡德通過軟件 ManyCam 創建虛擬網絡攝像頭,再將 Zoom 攝像頭設置為 ManyCam 虛擬網絡攝像頭,然後打開揚聲器,這個 Zoombot 就可以開始上班了!

現在,裡德已經將他的具體教程發表在了 GitHub 上,而且廣受關注。地址詳見:https://github.com/mcreed/zoombot。或許你也有興趣試一試。

儘管這項發明看起來頗具無厘頭色彩,因為在實際的使用過程中,它和真人參會的反應還是有比較多的區別,例如你能通過眨眼的頻次察覺出它並非真人(目前用來識別 DeepFake 視頻的方法之一就包括觀察眨眼頻率),但裡德確實展示了這樣的一種需求和可能性,原來視頻會議工具還能這麼玩。

畢竟,當裡德在真實的視頻會議中使用他的 Zoombot 時,確實給已經對視頻會議日益麻木的同事們帶來了很多歡樂。

或許有一天這樣詭異的景象真的會出現:打開一個視頻會議,可能參加的全是機器替身。


分享到:


相關文章: