阿里AI鑒黃師上線了,傳統人工鑒黃師要「涼涼」?

阿里AI鑑黃師上線了,傳統人工鑑黃師要“涼涼”?


近日,阿里 AI 鑑黃語音反垃圾服務上線公測了,不僅能識別色情圖片、視頻和文字,還能識別語音中存在的涉黃、廣告等違規信息。

之前,人工鑑黃師們通過一雙肉眼鑑別色情圖片和視頻。在外人看來這是 " 福利 ",但實際上並不輕鬆。如今,伴隨著互聯網上社交媒體、直播、短視頻的發展,每天光上傳的圖片超過 10 億張,發文數量超過 5 億條,不少色情、暴力等內容充斥其中。人工鑑黃師一天一人審核 1 萬張圖片的工作量,遠遠滿足不了這一需求。

2015 年 10 月,阿里巴巴 " 綠網 " 上線,用人工智能識別網絡上包括色情、暴力在內的違規信息,阿里 AI 鑑黃師應運而生。通過人工智能、深度學習和大數據樣本等技術,阿里巴巴的 AI 鑑黃師訓練識別千萬張正常圖片與色情圖片,最終生成一個智能鑑黃模型。

" 我們要做的就是拿圖片去‘餵養’它,讓它不斷學習,變得越來越聰明。" 阿里巴巴安全部高級算法工程師威視介紹:" 最初在獲取樣本時,我們篩選了近 2000 網站、6000 多萬色情圖片,經過去重,標註 1300 多萬張高質量的色情圖片,可以說這是 AI 鑑黃最重要的一塊基石。"

阿里安全,一向致力於解決社會問題,可以說,高效率、低成本的阿里 AI 鑑黃技術,正將人工鑑黃師逐漸解放出來。威視表示:AI 鑑黃師每天可審核數億張圖片,識別準確率高於 99.5%。舉個例子,一天要審核 4 億張圖片的話,單純由人工來審,一人一天審 1 萬張,需要 4 萬人,而 AI 鑑黃只需將其中 20 萬張可疑的圖片篩出來,由人工再審一道,這需要 20 人即可。

更厲害的是,阿里 AI 鑑黃師不僅能鑑別黃片黃圖,連帶有情色信息的語音內容都能識別。近期上線公測的 AI 語音鑑黃反垃圾服務,可支持中文、日文、英文等多國語言,還支持東北、四川、廣東等地方言。無語義的呻吟聲也能識別出來。8 月 21 日在北京召開的 2018 年網絡安全生態峰會上,這些成果將集中展示。

當然,目前來講,AI 鑑黃並不能完全取代人工鑑黃,相比人工審核,機器還很難理解內容背後的深意。" 最佳的審核方式是智能為主,人工為輔。人工鑑黃師群體數量少了,目前主要做打標和審查可疑圖片的工作。" 阿里安全部產品專家念夏說。

阿里AI鑑黃師上線了,傳統人工鑑黃師要“涼涼”?



分享到:


相關文章: