百度研究院的AI“剪輯師”上崗了科技頭條網

2020-04-21 12:42:06 鈦媒體APP

圖片來源@Unsplash

近日，百度研究院推出了一個“黑科技”平臺VidPress，可以用AI一鍵完成短視頻剪輯。這是百度研究院孵化的業內首個支撐通用型、能夠大規模生產的智能視頻合成平臺。

據悉，用戶僅需一鍵輸入新聞的圖文內容鏈接，其餘工作可由VidPress平臺自動完成。自動化完成的步驟包括智能化的聚合視頻素材、生成解說詞、進行語音合成和音視頻對齊等工序。包括渲染導出在內，整套製作流程能夠在9分鐘以內完成，從發現熱點到最終生成視頻完成自動化。

該技術已經在百度旗下短視頻平臺好看視頻上獲得大量應用。根據好看視頻使用數據, 目前生成一個清晰度為720p、時長2分鐘左右的視頻，所需時長的中位數為2.5分鐘。平臺每天可以生產500到1000條視頻。

百度研究院數據顯示，VidPress所生成的視頻播放完成率比好看視頻的大盤高出15%，其中一些熱門視頻已經有了85萬的播放量。

AI“剪刀手”如何誕生？

在具體的操作上，第一個環節是素材的收集整理。用戶輸入圖文內容後, 例如輸入某條新聞事件的鏈接，平臺將基於NLP模型進行語義理解, 並通過主體模型聚合相關新聞素材，以及從同一主題相關新聞裡抽取更多的素材及其語義表徵，以此保證素材內容相關且豐富。

第二個環節，是語音生成解說詞，以及進行素材的深度挖掘與整理。

一方面，平臺基於多種語言模型對原文進行處理，自動生成一篇字數符合要求且適合視頻呈現的解說詞，並通過百度文字轉音頻服務(TTS)合成解說詞語音。

與此同時, 平臺會根據對原文的理解, 通過自有視頻庫和百度全網搜索，對最新最適合呈現的內容進行聚合。利用人臉識別、物體識別、視頻內容理解等計算機視覺服務技術進行解析，完成視頻素材的剪切組合。

上述兩個步驟完成後，平臺將基於解說詞的音軌時間軸和所聚合的媒體片段，進入音視頻對齊剪輯過程。

此處應用的時間軸對齊算法，能夠選取出文本中的興趣點, 再將媒體片段與興趣點進行相關度打分，將優質媒體片段優先放入時間軸，希望以此引發用戶的興趣。在時間軸生成完畢後，數據將轉交給渲染器生成完整視頻，整合過程耗時可以保證在9分鐘以內。

“一鍵式“操作行不行？

對於AI剪視頻功能，鈦媒體也在第一時間進行了體驗。

如圖，用戶需要輸入文章鏈接，鏈接目前僅支持百家號文章，建議是娛樂類內容。用戶可以自行選擇發音類型和視頻時長。

圖文生成視頻界面

鈦媒體以《誰來保衛我們的白衣天使？》一文為例進行了體驗。以下為百度AI生成的視頻新聞：

如視頻所示，視頻解說詞由AI自動生成，雖然內容上有些不連貫，但基本選取了文章中的關鍵內容，能夠看出文章的大體脈絡。

在使用體驗上，該產品更多針對的是新媒體小白用戶，可以實現“傻瓜式”操作，相對比較友好。新聞體裁上，該產品更適合快訊型視頻新聞，可以一定程度上減少人力和時間成本。

但另一方面，由於強調AI全自動剪輯，全部視頻內容均由AI自動組合，用戶無法對內容進行修改和編輯，因此也存在很大的侷限性。如果在視頻生成前，VidPress可以給用戶權限進行修改和編輯，那在剪輯產品中可能會更有競爭力。

除此以外，素材的版權問題也存在隱憂。該平臺抓取的素材來源於百度自有視頻庫和百度搜索引擎，而搜索引擎裡的內容百度並非都有版權。特別是在用戶提供的鏈接內容信息量不夠時，AI就會更依賴外部抓取，其中不僅有素材，還有成品。

在鈦媒體體驗過程中，也出現了AI自動抓取到一些視頻自媒體原創作品的情況。顯然，想要做全自動化的AI視頻剪輯，版權問題也不可小覷。

當前，VidPress仍然是個基礎版。百度方面表示，AI新聞視頻還存在很多可能性。例如，可以針對不同垂直分類或投放渠道進行定製合成，又或者是針對用戶特點進行視頻定製等等。

（本文首發鈦媒體，作者/蘆依，編輯/宇航，鈦媒體編輯Yitao對本文亦有貢獻）

分享到:

閱讀更多 鈦媒體APP 的文章

關鍵字: 美好，一直在身邊自媒體剪輯

百度研究院的AI“剪輯師”上崗了

AI“剪刀手”如何誕生？

“一鍵式“操作行不行？

相關文章:

iOS 14代碼洩露再爆重要功能：“剪輯”讓用戶無需下載即可使用應用程序

剛剛工作的畢業生，一個月只有2000多，是不是太少了？

為什麼只有edg賺錢？

網上羅馬仕充電寶20000毫安的，參數怎麼很多樣？哪個是真的？

我們買的新商品房還沒有拿到房產證，怎麼轉賣最好？

為什麼突厥人可以成功復國？是大唐的刀不鋒利了麼？

小高層16層高樓間距60米哪一層比較好？

金銀花盆栽好養嗎？怎麼養？

長城對於抵禦古代匈奴和蒙古人起到了多大作用？

什麼樹可以嫁接臘梅？

行情堪憂，還有多少教育機構的老師們五一假期有課上的？課時量多不多？

在農村“立夏節”都有哪些民間習俗？

男朋友失望分手，但對我還有感覺，答應我兩個月之後可以在一起，我應該怎麼做，才能改變之前他對我的看法？

工程分包乙方人員傷殘誰承擔？

有哪些看起來毫不相關的兩個歷史人物實際上有過聯繫？

13年雪鐵龍世嘉自動擋7萬多公里，沒有水泡事故，多少錢能買？

22+吃土少女17年就有駕駛證了，今年才開始開車，想買個二手昂克賽拉，或者有什麼好建議嗎？

如何騎車去臺灣騎行？

本人預算5萬左右，想買一輛二手法系車！求推薦？

14年進口馬自達5PK進口10年道奇酷威買哪個划算？

2020年，河南教育行業國務院特殊津貼推薦，河南大學並列第三，大家怎麼看？

本田CRV2019款1.5T舒適版油耗高嗎？

國外疫情如果沒有得到有效控制，世界會發生什麼事情？頭腦風暴？

本田XRV這款車的整體表現怎麼樣？我想買1.5T自動豪華版，全款多少錢？

現在存款有14萬，借了5萬還沒收回來，該做什麼好？

2070super和5700xt買哪個比較好？

生完二胎後，感覺自己有點抑鬱，總是想發火，特別煩躁，怎麼辦？

人這一生遇到的人和事為什麼感覺都像是必然的經歷？

現在校內校外到底教的是美式英語還是英式英語還是混搭英語？

上有老下有小，我們真的跳不出這個人生循環了嗎？

如果外面正在下小雨，你會突然想起了誰？

初中同學許久未見大學期間突然聯繫請吃飯，態度還良好，我給推了，會不會讓人很煩？

現在我覺得認真對某個人說我喜歡你什麼的這種話好惡心，我愛你更說不出口，好惡心，是什麼心理？

劇版的《何以笙簫默》和《再見王瀝川》哪一個更好看呢？

計算機專業本科能夠進入字節跳動、華為這些公司做開發嗎？是否還需要繼續讀研？

生完二胎的你們，現在有什麼感想？

華北適合種植蠶豆嗎？

華為手機更新EMUI10.1系統後效果咋樣？

大熱天蜜蜂老是爬到箱外結群正常嗎？

辣椒正是生長最佳期，偏偏有的辣椒苗蔫，不是病蟲害是咋回事？

手機相機發展的最終形態會是怎樣的？

華為為什麼不出一款5寸全面屏手機呢？我想應該會有很多人支持吧？

生吃山芋，生吃胡蘿蔔，還有哪些蔬菜可以生吃呢？

為什麼馬鈴薯不宜過早過遲播種？

疫情愈發嚴重，原油為何反而大漲？

生菜球很好吃，怎麼種植才能高產呢？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？ ？

大家幫忙看看這個房子如果要砸牆的話，怎麼改比較好？

意蜂夏季喝什麼水降溫？

黃瓜種子催芽後種植需要打底水嗎？

書友們展示一下自我感覺發揮較好的作品，一起學習？

婚前男方擁有個人房產，婚後將這房產賣出用這房產的錢來買房，怎麼算個人財產？

男方出首付，婚後一起還房貸，房產證名字怎麼寫？

女兒離婚，婆家有3套房產，但都是婚前財產，父母應該怎麼樣為女兒爭取利益？

三星低端A40S以及中高端A80值得購買嗎？

如何看待今年高考報考人數超過一千萬人？

97分！利物浦成五大聯賽最高分亞軍，與衛冕冠軍曼城只有“一分之差”，是不是太苦了？

榮耀20值得等待嗎？還是入手榮耀v20？謝謝？

曼聯0-2卡迪夫，博格巴謝場時遭球迷辱罵，其豎大拇指+雙手合十回應，你怎麼評價？

泰迪一定要吃狗糧嗎？

銀行職員將存款500元打成500萬元，儲戶把錢用完了需要擔法律責任嗎？為什麼？

拉布拉多和金毛犬養哪一個比較好？

貝爾本賽季表現並不差，為什麼會遭齊祖徹底放棄？

在取款機裡取到假幣該怎麼辦？

如果有張（J036519610）紙幣，能否認定年號鈔嗎？聽聽大家的看法？

2019版人民幣將要發行，那麼99版和05版現在值得去收藏嗎？

不流通的舊人民幣值多少錢，該如何處理？

第四套人民幣豹子號值錢嗎？

第四套人民幣豹子號值錢嗎？

怎麼分辨902綠幽靈？

EXCEL如何把數值批量轉換成文本？

閬中古城離廣元市多遠？

宜賓：情感糾紛女子背幼子欲跳橋，路過民警救下, 你怎麼看？

Excel中，有哪些激動人心的功能？

Word有什麼技巧是讓你相見恨晚的？

excel中的數據有效性怎麼用？

裝修高手來幫忙看下144平，套內122平，怎麼三房改四房？？