AI審圖，一天鑑別數億張，人類鑒黃師要涼涼其它頭條網

直播火了，也讓人們實現了足不出戶，便可見眾生千面。

這是我們的時代獨有的烙印，無論是網紅、明星、互聯網大佬，還是如同你我的素人，拿出手機，鏡頭一開，就能與屏幕上千千萬萬的看客產生關聯。

而在這種情況下，不少主播打起了擦邊球，不管是裸露，還是性感，總之，他們會想盡辦法試圖以最快的時間讓自己一炮而紅，從而獲取最大的利益。在這種情況下，鑑黃師應運而生。

據瞭解，一個鑑黃師平均一天要看2萬張圖，為防止漏網之魚，經常要三班倒，面對大量黃圖鑑定分類，常常身心俱疲。而關於直播鑑黃，傳統的處理方法是用戶舉報配以平臺的人工抽檢巡邏，效率低下且具有諸多盲點。許多別有用心的人士利用人工的弱點，專挑敏感的時間點（凌晨時分）等進行播放，讓鑑黃工作難免有疏漏。

另一方面，直播平臺聘請大量鑑黃師是一筆不菲的成本，高峰時期尤其備受考驗和壓力。比如，映客的相關負責人曾表示，

“為了對主播監管，我們成立了800人的審核隊伍。實際上，當直播高峰期，成千上萬的主播在線，可以說鑑黃隊伍真是寡不敵眾。”

在這種情況下，人工智能便上場了。相比之下，人工智能鑑黃優勢凸顯，能夠24小時不間斷網絡巡航，大大降低鑑黃成本。

最新消息顯示，阿里AI鑑黃語音反垃圾服務上線公測，能識別語音中存在的涉黃、廣告等違規信息。這意味著，除識別色情圖片、色情視頻和色情文字外，涉黃語音也能通過AI鑑別了。

事實上，早在2015年10月的時候，阿里就上線了“綠網”，用人工智能來識別網絡上包括色情、暴力在內的違規信息。在這種情況下，阿里鑑黃師出現了。通過人工智能、深度學習和大數據樣本等技術，阿里巴巴的AI鑑黃師訓練識別千萬張正常圖片與色情圖片，最終生成一個智能鑑黃模型。

對此，阿里巴巴安全部高級算法工程師威視表示，“我們要做的就是拿圖片去‘餵養’它，讓它不斷學習，變得越來越聰明。最初在獲取樣本時，我們篩選了近2000網站、6000多萬色情圖片，經過去重，標註1300多萬張高質量的色情圖片，可以說這是AI鑑黃最重要的一塊基石。”

更重要的是，阿里AI鑑黃師不僅能鑑別黃片黃圖，連帶有情色信息的語音內容都能識別。近期上線公測的AI語音鑑黃反垃圾服務，可支持中文、日文、英文等多國語言，還支持東北、四川、廣東等地方言。此外，無語義的呻吟聲也能識別出來。可以說，這項技術已經很厲害了。

當然，除了阿里外，還有不少企業試圖通過人工智能來識別出那些有害的言論和圖片視頻。比如，此前，Facebook應用機器學習部門主管Joaquin Candela表示，該公司正在開發一項新的系統工具，可以在直播視頻中對令人反感的違規內容進行自動標記。目前，這一自動標記系統工具已開始在Facebook視頻直播產品Facebook Live上進行測試，以求營造良好的網絡社區環境。

另外，雅虎也曾對外開源了一套深度學習神經網絡，它專門用於自動檢測圖片是否含有色情內容。神經網絡使用了CaffeOnSpark系統，基於Hadoop/Spark的分佈式深度學習框架，能有效鑑別圖片是否含有色情成分。

雖然到目前為止，AI鑑黃師還不能完全取代人工，但至少在人工為主，機器為輔的情況下，打標和審查可疑圖片的工作會變得相對輕鬆一些，人工沒有那麼大的壓力。

分享到:

閱讀更多 AI前沿觀察 的文章

關鍵字: 人工智能大數據 Facebook