AI領域的風口內容審核能成為下一個麼？

2020-02-26 16:17:35 AiChinaTech

一直以來，由於相關法律法規的規定，視頻中不能含有血腥暴力畫面，很多視頻up主在上傳血腥暴力視頻前，會將視頻中涉及到血液的顏色改為藍青紫等顏色。還有一些沒有做改色的up主，在人工審核的失誤下，也會僥倖過審。甚至一些視頻因為內容的特殊性，比如遊戲錄屏、或者衣著時尚、遮蔽較少，就會進入審核，需要系統來檢測是否違規視頻的發佈機制。再比如近年來大火的快手、抖音等短視頻app，作為當下年輕人最喜愛的互動交流媒體，每日的短視頻生產成千上萬，如何能夠用AI技術高精準的審核這些視頻，也成為了各大AI企業值得思考的問題。

人工智能和深度學習下的識別和推理

傳統意義上的深度學習算法以有監督的方式進行訓練，以識別特定類別的事物。在一個典型的任務中，可能會訓練DNN以可視化的方式識別一定數量的類。例如一張只有蘋果和香蕉的圖片，深度學習算法在獲得大量數據和質量的數據時，非常擅長進行精確、低錯誤率和可信的分類。當第三個未知對象出現時，DNN識別就會出現問題。如果引入了訓練集中不存在的未知對象，例如橙色，DNN 網絡將被迫猜測，並將橙色分類為捕獲未知對象的最接近類別一個蘋果。基本上用蘋果、香蕉訓練的DNN的世界完全由蘋果和香蕉組成，機器想不到水果籃裡還有其他的水果。

在訓練過程中，如果 DNN 能夠將項目分類為“蘋果”，“香蕉”或“什麼都沒有”，算法的開發人員可以確定是否還有尚未有效學習識別的類別。也就是如果水果圖片繼續反饋“零”，那麼開發人員可能需要添加另一類“水果”來進行識別，例如橘子。

以AI創業公司Neurala為例，在2017年宣佈在深度學習軟件方面取得重大進展，其Lifelong DNN軟件能夠能夠在邊緣學習增量對象。在此之前，如果一個AI系統學會了一定數量的對象，並且需要再學習一次，那麼它必須針對所有對象再訓練一次。這種傳統方法需要利用強大的服務器，通常是雲上的服務器。

Neurala的Lifelong DNN既能在運行中學習，也能在邊緣學習的能力意味著 Neurala 的新方法可以直接在設備上學習，從而不會有云上學習的所有缺點。此外，它消除了網絡延遲，提高了實時性能，並在需要時確保隱私。最重要的是，它將促進一系列無雲應用的開發。對此吳恩達也評價了從雲到“邊緣”轉化的技術，認為這會加速消費級IoT，帶來新的贏家。

Lifelong DNN 的機制和人類的學習方式類似：我們在潛意識中不斷檢查我們的預測是否符合現實世界。例如，如果有人跟你開玩笑調整了你辦公椅的高度，你馬上就能意識到。那是因為隨著時間的推移，你學習到了辦公椅高度的“模型”，一旦模型有變，你會立即意識到異常。

人類不斷檢查我們的分類是否符合實際情況。如果沒有，我們的大腦就會注意到併發出警報。對人來來說，我們不僅可以認識蘋果、香蕉和蘋果，還可以推理“我還以為是蘋果，但實際上不是。”

商業化視頻審核下的多維度識別

當前，視頻審核多用於在商業化視頻中，而商業化視頻的數據特點，對算法系統的處理速度、效率和準確率提出了較高的要求。商業化視頻算法的總體框架分為五層：1、視頻輸入層進行視頻源的管理；2、視頻處理層進行鏡頭分割、採樣、增強和去噪等工作；3、內容提取層主要分析視頻中內容、語義等信息，進行目標檢測、跟蹤和識別等來檢測目標在視頻中的時間、空間、位置等維度；4、語義融合層進行目標軌跡融合、識別結果融合、特徵表示融合、高層語義融合等；5、在數據輸出層，進行結構化數據管理，方便後續數據檢索與應用。

視頻內容識別維度多樣，包括場景、物體、人臉、地標、Logo、情緒、動作、聲音等。不同維度的算法結構有所區別。人臉識別算法結構為：輸入視頻後進行鏡頭分割，在進行人臉檢測、跟蹤、人臉對齊，根據質量評估過濾，進行特徵提取和特徵比對識別，最後進行識別結果融合，輸入最終識別結果。

在場景識別算法結構中，首先對輸入視頻進行鏡頭分割採樣，有所不同的是隻需進行時間間隔分割的採樣，再對視頻進行場景類別的初分類，預處理之後進入卷積神經網合階段，卷積神經網絡通過對不同的數據集進行預訓練，得到不同的特徵和描述，將這些特徵進行融合、降維處理得到特徵表示後，對不同場景如高頻場景、次級場景和新增場景，進行分類處理，最終對識別結果進行融合。

在物體、Logo識別算法結構中，有所不同的是需要多尺度提取特徵，跟蹤識別物體軌跡，並關注物體類別，對結果進行優化。

在地標識別算法結構中，分為三步，第一，通過基礎網絡(VGG,ResNet等)獲得特徵圖(一般為最後一層卷積或池化層);第二，從特徵圖中提取特徵(例如R-Mac,SPoC,CroW,GeM等)並用ROI Pooling,PCA 白化，L2-歸一化等方式處理，一般最終維度為256,512,1024,或2048;用kNN,MR,DBA,QE,Diffusion等方式將得到的特徵對數據庫內的特徵進行後處理獲得最終特徵；訓練模型一般損失函數採用contrastive loss或triplet loss,最終比對一般採用餘弦或歐式距離。

以國內的AI初創企業極鏈科技Video++為例，其推出的神眼系統通過人工智能技術，打造了一個全棧式智能內容安全審核引擎。該系統能對視頻、圖片、文本的內容進行審核，查找出裡面的政治敏感內容、暴力恐怖內容以及色情內容等等不合規的部分。作為一個檢測系統，神眼有著獨特的AI算法，可以逐幀檢測，跟蹤軌跡流。並且在輸出階段，有著三次審核流程，可以確保結果的準確性。

小結：如今人工智能正逐漸滲透到各行各業中，針對視頻內容抄襲和重複、不良視頻內容編輯後二次傳播的問題，越來越多的企業作出了自己的解決辦法。從長期的視角來看，AI機器審核要更為重要。現在的審核多為先AI機審，有問題的再進行人工審，AI機審會審核掉大多數的內容，並且隨著算法的不斷升級和對人工審核的神經學習，AI機審會變得越來越智能。計算機的處理速度和知識儲備也都遠在審核人員之上，即使是當下的視角，AI機器審核也擁有著獨特的地位，或許在視頻發展迅速的未來，AI內容安全審核會成為互聯網下一個重要風口。

分享到:

閱讀更多 AiChinaTech 的文章

關鍵字: 人工智能香蕉可視化技術

焦點分析丨小紅書直播另類突圍：不求全網最低價、互動為先

36氪從接近小紅書的人士處瞭解到，直播業務目前已升級為“Project

嘗美食、遛萌寵，看露天電影、練戶外瑜伽…魔都好玩的市集都在這兒了

市集復興啦！

全國女人們都在晒一塊布：制霸朋友圈就靠它了！網友評論非常精彩

不知道是不是大家都在家裡憋了太久，@媛媛

全市新媒體賬號注意了，快來這裡登記備案！

衡水市互聯網信息辦公室關於在全市開展新媒體賬號登記（更新）備案工作的通告為進一步加強全市新媒體管理工作，規範傳播運營秩序，營造清朗網絡環境，依據《中華人民共和國網絡安全法》《互聯網信息服務管理辦法》《網絡信息內容生態治理規定》《具有輿論屬性和社會動員能力的互聯網信息服務安全評估規

戰疫日報｜31省份新增新冠肺炎無症狀感染者6例

石家莊市“團結拼搏大美滹沱”籃球聯誼賽正式開賽

5月5日，在滹沱河生態修復二期工程唐襟風清景區施工現場，“團結拼搏

弱者才玩情懷！"大鯊魚"美國銷售額超戴森2倍，隨手一吸乾乾淨淨

在競爭如此慘烈的市場環境中，各種大小型公司為了廣告營銷手段層出不窮，碰瓷營銷、跨界營銷、炒作營銷等方法幾乎隨處可見，而這其中最常見的就是情懷營銷，這種情懷可能是懷舊、可能是愛國、可能是其他……情懷營銷之所以能夠如此“放肆”，主要是是藉助了大多人都會感同身受的一些東西來進行深層推廣

運營技能地圖整理（七）：短視頻運營

共有10大部分，包括：一、社群運營二、活動策劃三、轉化文案四、數據分析五、To

開學了，學生如何科學佩戴口罩

隨著開學的信息越來越多，孩子們迴歸校園的腳步越來越近，兒童口罩成為家長們正在準備的“重要物資”。記者調查發現，儘管與小小口罩已經相伴了一段時間，但如何選擇、怎麼使用，不少人還有認識上的誤區。返校開學後，該如何為孩子選擇安全性和舒適性兼備的口罩?是否需要全天佩戴口罩?

5·8世界微笑日：花式微笑使用手冊指南

《早安，嶺南》是一檔由南方日報地方新聞部打造的輕資訊+泛娛樂的音頻脫口秀欄目，逢週二、四、六早八點播出。

來，乾了這杯氨基酸

作為國飲的茶葉，以豐富的內含物質帶來的健康作用成為賣點，然而在商家的宣傳中不乏謬誤，令茶客們也無所適從，莫辨真假，其中茶毫的概念便令許多人困惑。

寧德時代首套海洋船舶動力電池系統成功下線

“深海01”搭載的正是寧德時代的鋰離子動力電池系統，此次下水也標誌著寧德時代首套海洋船舶動力電池系統成功下線。

以賽促銷售用賽提品質貴州“鬥茶”帶來蝴蝶效應

貴州省9個市貴安新區經過42場初賽，從526家企業672種茶樣中推選出4大類133只茶樣參加省決賽。

實體書店裡不只有圖書

在升級轉型中，許多書店進軍文創領域，開闢文創生活美學空間、引進或自主開發文創產品，滿足不同讀者群體的多樣需求。

普通人是否能做自媒體，是否真的可能月入過萬？

目前有很多自媒體人通過創造實現了財務自由，成了網紅、大V，這使得大眾非常羨慕、躍躍欲試，但又擔心自己的付出沒有收穫，也擔心目前已經過了自媒體的風口，掙不到錢了。

在美國潮牌眼中：香港是"國家"，臺灣也是

據臺灣綠媒《自由時報》6日消息，美國洛杉磯潮牌UNIF日前罔顧事實，堅持聲稱香港、臺灣是“國家”。在該品牌線上店鋪購買衣服的大陸網友因此非常不滿，私信UNIF官方Instagram抗議後，卻被回覆“香港是國家，臺灣也是。

作者苦平臺久矣

隨即有作者爆出“霸王合同”事件，閱文集團5天3次回應，卻未能阻止該事件進一步發酵。作者苦平臺久矣。保護創新、完善行業發展規則並不排斥商業邏輯，但一昧向利潤低頭、屈從於商業邏輯，尊崇流量至上、平臺至上、贏家通吃等叢林法則，毫無疑問會摧毀創新的萌芽，最終只能得到圈地自萌式的一地雞毛和

開學了，學生如何科學佩戴口罩

記者調查發現，儘管與小小口罩已經相伴了一段時間，但如何選擇、怎麼使用，不少人還有認識上的誤區。東華大學紡織學院教授靳向煜表示，佩戴口罩好比給自己的呼吸系統設置了一道“過濾屏障”，既要阻隔顆粒物、飛沫等，又要保證呼吸順暢:“由於生理特點的不同，小兒肺容量僅有成人的1/6，潮氣量也比

四川盆地獲重要天然氣發現預計資源量超萬億立方米

新華社成都5月6日電中國石油西南油氣田公司對外披露，該公司近日發現了一條富含天然氣的新區帶，預計潛在資源量超萬億立方米。

“折戟”17次之後，騰訊的短視頻夢想靠什麼出圈？

如今，同樣是作為微信的二級頁面，“視頻號”也已經內測三個月有餘，不少從業者都認為，這段時間並不算短，足以對其產品調性和運營導向描摹出一個大概輪廓。

為珠峰“量身高”，為什麼一定要有人登頂測量？

新華社珠峰大本營5月6日電6日，2020珠峰高程測量行動測量登山隊舉行出發儀式，30多名計劃登頂的測量登山隊員當日從海拔5200米的珠峰登山大本營向更高海拔出發，計劃抓住近日的天氣窗口，擇日登頂測量。

B站《後浪》模仿了120年前的舊文，靠什麼感動了100萬當下青年？

B站《後浪》的“火爆”程度不多說了。“五四”青年節當天，播放量達獲得530餘萬的播放，2.1萬彈幕，40.3萬收藏。從本質來說，它其實是一瓶“舊酒”，陳釀120年，甚至更久遠。

2020珠峰高程測量登山隊進入登頂測量階段

中新社拉薩5月6日電

作家非“聘請”閱文承諾改舊合同作家可選擇是否免費

在懇談會上，閱文方面表示，針對過去多年來合同中遺留下來的不合理之處，應該也必須修改，對於作家應有的權力應該明確在條款裡。

廣西南寧：小學四至六年級開學復課

濟南天橋區警方：一名男子持刀砍人致一死一傷，有精神病史

(本文來自澎湃新聞，更多原創資訊請下載“澎湃新聞”APP)

昨天寫了一篇文章，被頭條推薦將近100萬，是怎麼做到的？

很遺憾，我真的不知道。不過昨天這條文章，不是從發佈完就被推薦的，昨天一天還是幾十個閱讀量，今天下午下子就上來了！截止目前，已經快100萬的推薦量！雖然我經常發佈文章，但我對頭條的推薦機制並不太清楚，我只是一個興趣！

湖南張家界：特色手工藝品砂石畫

抖音投放費用怎麼收取？哪種收費模式更便宜？

提起抖音廣告投放，廣告主們最關心的就是費用問題，抖音投放廣告費用取決於你選擇哪種投放，最低是0.2元/次。

最新：全球超363萬例，美國超120萬例

來源：人民日報新媒體，製圖：劉珂君，策劃：李志偉、賈雪、來飛雨本期編輯：李娜、楊翹楚

中國口罩出海記

eWTP（世界電子貿易平臺）比利時樞紐的列日機場成為歐洲救援樞紐。中國捐給歐洲的抗疫物資大多在這裡最先落地，再運往各國。eWTP列日倉的中國工作人員王丹第說：“都是救命物資，必須保證24小時內出倉。

抖音運動產品怎麼做推廣？廣告費用高嗎？

以前，大家的娛樂方式是看電視、刷微博，現在，已經變成刷抖音、看快手，短視頻的風潮是一浪接一浪，抖音更是引領了一個“網紅經濟”時代的到來，都堪稱“網紅”製造機，而“網紅臉”甚至已經成為一種審美符號。

多面龔文祥：武大畢業，10年自媒體，年賺5000萬，中國紅包一哥

他籍貫湖北仙桃，畢業於武大，做了十幾年的自媒體，混出了一個自媒體首富。但令人驚奇的是，他從來不寫長文，公眾號粉絲也寥寥無幾，十萬+更是與他絕緣。

閱文新管理層迴應“合同風波”：將修改爭議條款，1個月內推出新版合同

會上，閱文集團新任CEO程武、總裁侯曉楠、總編輯楊晨等新管理團隊與多位作家就網絡文學生態、創作環境優化以及“作家合同爭議”等問題進行了深入討論，並提出了一些解決方案。

B站“浪”出圈被群嘲：後浪們，你們為什麼不買B站的帳？

五四青年節前夕，B站聯合光明日報、新京報、澎湃新聞等主流媒體，發佈了獻給新一代的演講《後浪》。654字鏗鏘的演講稿，演員何冰3分鐘深沉的表述，加之B站UP主們的精彩片段，截至目前，該視頻已獲得了超過1000萬的播放量。

如果天氣良好珠峰高程測量登山隊員將於今晚抵達5800米營地

5月6日中午，2020珠峰高程測量登山隊從海拔5200米的登山大本營出發，35名測量登山隊員開啟珠峰衝頂測量。

閱文將推新版合同：著作人身權歸作者，免費付費由作者選擇

5月6日，備受關注的閱文作家懇談會召開，CEO程武、總裁侯曉楠、總編輯楊晨等新管理團隊出席，多位網文作家參加。

乾貨#收款文案的核心：只能讓客戶好奇不能滿足客戶就對了

收款文案的核心：只能讓客戶好奇，不能滿足客戶就對了，不付錢，永遠心癢癢。（如果你的文案）比如舉一個例子吧，嗯，看來大概十年前有一個p2p企業，企業裡面排名排到前二十名的網站去找你，他們找你諮詢他們有一個問題解決不了，他們找了好多公司都解決不了。

「瀘州微信周榜」0426-0502

本榜單整理了目前瀘州地區微信公眾號排行情況，數據由清華大學@新媒體指數

你的錢花在哪了？“95後”讓人刮目相看！這項調查火遍朋友圈→

近日，央視財經新媒體聯合《中國經濟生活大調查》推出首個“央視財經大數據”——《2019-2020中國青年消費報告》。

自媒體下載圖片太麻煩？油猴腳本一鍵下載Pixababy免費無版權圖片

不管你從事何種與自媒體相關的職業，你都需要小心使用圖片，以免哪天收到一張律師“邀請函”。Pixabay是非常受歡迎的一個國外免費無版權圖片、視頻下載網站，深受廣大自媒體愛好者喜歡。

社群苦心經營卻死氣沉沉？一文解開你的母嬰社群營銷心結

突發的疫情給線下流量的衝擊特別大，而線上的投放流量在逐漸消失，母嬰企業如何挖掘用戶價值，從存量中找增量構建自己新的分銷渠道?

抖音Dou+是什麼？Dou+推廣優勢在哪裡？

抖音Dou+推廣非常有優勢，可以漲粉建號、降低觸達成本、實現廣告精準觸達。最近很多客戶反應，抖音上面新增了一個Dou+功能，但是不知道這是拿來幹嘛的?

網文平臺也有“流量焦慮”

據2月18日，中國社科院發佈的《2019年度網絡文學發展報告》，去年國內網絡文學用戶數量已達4.55億，在網文活躍用戶中，95後讀者佔54.5%;

社群裂變+直播，5分鐘快速瞭解新賽道，1000萬人氣，600萬銷售額

疫情不是我們經濟低迷的理由，對於品牌，企業，個體來說，這是給我們敲醒了警鐘，商業環境的變化，這是“人，貨，場”的重新構造。

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度

此前，我國測繪工作者已對珠峰進行過6次大規模的測繪和科考工作，並先後於

B站《後浪》：文案太過失敗，這頓罵還真不冤枉

為了不被反感，並且真正起到『

《後浪》引爭議：創作者媒體意識缺失，但沒人願意“被成為”憤青

為了不被反感，並且真正起到『

為什麼是B站？

2020年5月4日，嗶哩嗶哩，一家於2010年正式推出的視頻網站，在它的10週年之際，發佈為年輕人點讚的廣告片《後浪》，不到半天時間，刷屏數億人朋友圈，甚至登上央視，好評噼裡啪啦的打在B站官網評論區。

再一次出圈？《後浪》刷爆朋友圈，B站股價一度漲超15%

近日，B站獻給新一代的演講《後浪》成為一次現象級策劃，在各大社交平臺被熱議。有人認為這種演講方式很古板，也有人認為它說出了當代B站年輕人的心聲，無論如何，B站再次“出圈”。

AI領域的風口 內容審核能成為下一個麼？

相關文章:

焦點分析丨小紅書直播另類突圍：不求全網最低價、互動為先

嘗美食、遛萌寵，看露天電影、練戶外瑜伽…魔都好玩的市集都在這兒了

全國女人們都在晒一塊布：制霸朋友圈就靠它了！網友評論非常精彩

全市新媒體賬號注意了，快來這裡登記備案！

戰疫日報｜31省份新增新冠肺炎無症狀感染者6例

石家莊市“團結拼搏 大美滹沱”籃球聯誼賽正式開賽

弱者才玩情懷！"大鯊魚"美國銷售額超戴森2倍，隨手一吸乾乾淨淨

運營技能地圖 整理 （七）：短視頻運營

開學了，學生如何科學佩戴口罩

5·8世界微笑日：花式微笑使用手冊指南

來，乾了這杯氨基酸

寧德時代首套海洋船舶動力電池系統成功下線

以賽促銷售 用賽提品質 貴州“鬥茶”帶來蝴蝶效應

實體書店裡 不只有圖書

普通人是否能做自媒體，是否真的可能月入過萬？

在美國潮牌眼中：香港是"國家"，臺灣也是

作者苦平臺久矣

開學了，學生如何科學佩戴口罩

四川盆地獲重要天然氣發現 預計資源量超萬億立方米

“折戟”17次之後，騰訊的短視頻夢想靠什麼出圈？

為珠峰“量身高”，為什麼一定要有人登頂測量？

B站《後浪》模仿了120年前的舊文，靠什麼感動了100萬當下青年？

2020珠峰高程測量登山隊進入登頂測量階段

作家非“聘請”閱文承諾改舊合同 作家可選擇是否免費

廣西南寧：小學四至六年級開學復課

濟南天橋區警方：一名男子持刀砍人致一死一傷，有精神病史

昨天寫了一篇文章，被頭條推薦將近100萬，是怎麼做到的？

湖南張家界：特色手工藝品砂石畫

抖音投放費用怎麼收取？哪種收費模式更便宜？

最新：全球超363萬例，美國超120萬例

中國口罩出海記

抖音運動產品怎麼做推廣？廣告費用高嗎？

多面龔文祥：武大畢業，10年自媒體，年賺5000萬，中國紅包一哥

閱文新管理層迴應“合同風波”：將修改爭議條款，1個月內推出新版合同

B站“浪”出圈被群嘲：後浪們，你們為什麼不買B站的帳？

如果天氣良好 珠峰高程測量登山隊員將於今晚抵達5800米營地

閱文將推新版合同：著作人身權歸作者，免費付費由作者選擇

乾貨#收款文案的核心：只能讓客戶好奇不能滿足客戶就對了

「瀘州微信周榜」0426-0502

你的錢花在哪了？“95後”讓人刮目相看！這項調查火遍朋友圈→

自媒體下載圖片太麻煩？油猴腳本一鍵下載Pixababy免費無版權圖片

社群苦心經營卻死氣沉沉？一文解開你的母嬰社群營銷心結

抖音Dou+是什麼？Dou+推廣優勢在哪裡？

網文平臺也有“流量焦慮”

社群裂變+直播，5分鐘快速瞭解新賽道，1000萬人氣，600萬銷售額

2020珠峰高程複測出發儀式今日舉行 小米10全程助力丈量世界新高度

B站《後浪》：文案太過失敗，這頓罵還真不冤枉

《後浪》引爭議：創作者媒體意識缺失，但沒人願意“被成為”憤青

為什麼是B站？

再一次出圈？《後浪》刷爆朋友圈，B站股價一度漲超15%

AI領域的風口內容審核能成為下一個麼？

石家莊市“團結拼搏大美滹沱”籃球聯誼賽正式開賽

運營技能地圖整理（七）：短視頻運營

以賽促銷售用賽提品質貴州“鬥茶”帶來蝴蝶效應

實體書店裡不只有圖書

四川盆地獲重要天然氣發現預計資源量超萬億立方米

作家非“聘請”閱文承諾改舊合同作家可選擇是否免費

如果天氣良好珠峰高程測量登山隊員將於今晚抵達5800米營地

2020珠峰高程複測出發儀式今日舉行小米10全程助力丈量世界新高度