03.06 從人工到機器 視頻審核要如何發展


視頻時代已然拉開帷幕。

根據2019年公佈的數據,Youtube全球月活已經突破19億,微信也超過了10億,可以說,視頻產業已經關聯到了全球的大部分人口。而隨著這種使用人數的激增,用戶時長和內容生產消費量級也呈現出了一個指數級的上升。在這海量的內容面前,無論是大平臺還是小公司都面臨著巨大的管理難度和審核挑戰。畢竟在大量視頻內容湧現的同時,暴力、色情內容也會隨之進入互聯網,成為用戶視頻瀏覽中的“定時炸彈”。

而這些大公司們自然也早有準備。2018年,Facebook推出DeepText,利用深層神經網絡架構理解內容。而YouTube早就推出了Content ID,監測並刪除涉及色情和暴力等違規視頻,多年來總計在該技術上花費了超過1億美元。在這個AI賦能一切的時代,人工智能似乎正在視頻內容的審核中大展拳腳。甚至不少媒體都預言,AI將憑藉著其對海量數據的組織能力,不久後會取代人工審核。


從人工到機器 視頻審核要如何發展

然而事實上,人工審核是很難被機器完全替代的。

AI審核存在兩個技術難點,一個是算法準確率問題。在業內有句話,“脫離數據集來談準確率都是耍流氓”,這就是說,用數據集訓練出來的AI模型並不都能匹配實際行為,還存在用戶行為偏差等諸多影響因素,即使AI審核的準確率達到了99%,考慮到用戶上傳的視頻量,剩下1%的累計量也是驚人的。

另一個難關就是對內容的主觀判斷。簡單來說,不是所有露骨的內容都是色情,也不是所有色情視頻都有裸露,再加上視頻內容中涉及到的文字、語音等多方面情景混雜,對人來說較容易判斷,但對機器而言需要多個算法疊加。

要知道,AI參與視頻審核並非近幾年才有。早在2000年左右,就有公司在做這方面的嘗試。但那時,視頻審核需要人為設定特徵和規則,一直等到深度學習得到發展後,視頻審核才終於變得“靈活”了。但是,在視頻審核上,目前業內普遍採用的仍然是“人機結合”的方式,並且人工在其中佔據著重要比例。

YouTube的算法工程師便曾表示,目前YouTube上大部分視頻仍需要經過人工審核,被審核視頻一部分是AI檢測出來,一部分是用戶舉報的,但最終都需要專業的審核師把關決定是否違規。


從人工到機器 視頻審核要如何發展

此外,在利用AI進行內容審核時還要注意以下三點:

一是對內容的審核需要文化意識和對相關社區標準的語境理解。儘管AI可以執行預調節,幫助減少人工審核的工作量,但人工參與仍是不可缺少的環節。

二是AI面臨著公眾不信任,特別是可能存在無意識的人類或技術偏見。此外,算法可能對違規內容起不到檢測作用。針對此,一方面要定期分析並調整算法,利益相關者也應保證AI的透明度。

三是由於格式多樣性和內容複雜度,用戶生成的視頻內容越來越難以分析,它們需要被解釋為一個整體,以此來鑑定是否違規。為了更好地瞭解用戶行為,及時更新違規有害內容的定義,平臺和服務提供商之間最好能夠共享數據集,這有利於利益相關者獲得更好的文化意識和語境理解。

也正因此,目前業內有兩種比較常見的“人機配合”審核方式——一種是AI將相對確定的視頻進行分類,然後對部分用戶做出推薦,觀察用戶反應,其中高熱視頻會人工率先審核;另一種則是AI將視頻標記為“good”或“bad”,當審核師遇到標註有“bad”視頻時再細緻地審核,這也提高了審核效率。

比如說今日頭條採取的是第一種模式。視頻再得到大量推薦之前,會被機器試著推薦給首批用戶,根據他們的反映,來判斷你這條視頻是不是值得更多的推薦。如果數據是正向的,則會被推薦給更多的人;如果數據是負向的,則會減少或者停止推薦。

而極鏈科技video++採取的則是第二種模式,針對目前行業面臨的主要問題,結合人工智能技術,打造全棧式智能內容安全審核引擎——神眼系統,用AI技術幫助平臺方減輕內容審核壓力、降低內容審核成本,為客戶提供一站式的智能內容安全解決方案。


從人工到機器 視頻審核要如何發展

未來,隨著用戶和內容數量的繼續增長,內容審核的挑戰會越來越嚴峻,政策相關的監管也會越來越嚴格,語音和視頻的內容理解更加任重道遠。作為時代洪流的見證者,且讓我們拭目以待。


分享到:


相關文章: