2018-04-19 10:52:23 智趣派

“抖音”也被約談

繼今日頭條、網易新聞、天天快報等新聞客戶端下架，內涵段子永久下線之後，針對內容消費產品傳播社會負能量的調查和約談仍在繼續。

抖音短視頻

據人民網報道，近日，針對“抖音”短視頻平臺涉嫌發佈售假視頻的輿情報道，北京市工商局海淀分局及時對該平臺經營主體北京微播視界科技有限公司進行約談。約談會上，企業負責人反饋了調查情況，表示針對平臺涉嫌違規內容已採取刪除、封禁措施。截至目前，共查刪視頻805個，封禁賬號677個，添加違禁關鍵詞67組。

針對本次輿情問題，海淀工商分局向企業發佈行政提示書，並提出幾點建議：一是高度重視本次輿情問題，強化主體責任意識，履行網絡服務提供者義務，及時反饋調查處理情況。二是完善維權機制，有效控制事態，高效處理關於平臺的投訴、舉報問題，切實保障民眾利益。三是加強技術監測與人工審核力度，通過系統技術篩查違法視頻、廣告文本，即時阻斷違規直播，同時結合人工審核，對違法視頻迅速做篩查下線處理。四是健全內部管理制度，完善對“抖音”平臺註冊用戶的身份認證、分級管理及跟進整治的管理流程，從源頭避免為售假內容提供傳播基礎，並立足企業長遠發展，完善制度建設。

受約談企業表示高度重視此次輿情問題，全面接受約談建議並將嚴格落實，反思排查企業管理的薄弱環節，重新定位產品開發，積極探索發展模式，從而更好地履行企業主體責任和社會責任。

技術手段：內容反作弊系統

作弊者往往出於利益

內容消費產品主要分為PGC和UGC產品。PGC一般由團體、大V等具有較高知名度和影響力的賬戶產生內容，一般內容深度和質量都較好，分發結構較為扁平，熱點效應比較明顯，典型的如今日頭條、手機百度、天天快報等新聞客戶端。UGC產品則一般是草根明星或普通用戶製作併發布的內容，其內容質量參差不齊，分發結構較為雜亂分散，典型的如快手、抖音等。

PGC產品相對而言，內容生產者較為少且比較注重產品質量，因此PGC產品反作弊壓力較小，通過信譽積分等手段能有效約束PGC生產者減少觸碰紅線的內容產生，因此更多是標題黨、擦邊球等較弱的反作弊需求。

UGC產品則不同，這類產品的內容生產者門檻較低，註冊後就可以發佈文章或音視頻內容，生產者可以通過各種手段註冊所謂的“小號”或者盜用他人賬號，來發布廣告甚至黃反內容。由於UGC產品用戶都可發佈，因此內容生產量往往較大，可以高出PGC產品數個數量級。因此，UGC反作弊系統對內容處理吞吐量、準確率、可用性等技術要求都更高。

反作弊這個命題本身比較大，例如惡意攻擊、刷評論、違規調用等安全或權限問題。而本文討論的核心是內容反作弊，即內容本身包含的信息是否可能是黃反或違規的。內容反作弊系統在設計和實現上可能千差萬別，但核心的功能則是對內容按照特定要求進行整理，通過規則系統或者模型系統對整理後的內容進行判定打分，對判定出黃反可能性較高的內容直接拒絕或者引入人工審核判定。而針對內容的不同，內容反作弊系統往往需要構建多條反作弊審查流程，例如文本、圖片、視頻這三類內容，對應的反作弊技術可能相差甚遠。

文本反作弊最為成熟，但也並不容易。最簡單的反作弊系統可以基於規則判定，確定黑名單詞表，命中黑名單詞表的判定為作弊內容。但這種手段太單一，而中文又博大精深，因此在準確度上很難保證。例如“加微信” 被轉成各種音譯“＋V信”等方式，詞表無法及時更新，人工加詞表成本巨大。因此，後來發展出基於多維度策略模型的打分判定，以及基於機器學習的黑庫模型判定，慢慢的會主動識別作弊特徵，提供識別準確率。

“抖音”被約談！內容消費產品該如何通過技術手段減小風險？

包含廣告和聯繫方式的圖片

圖片反作弊也相對成熟，對於包含廣告信息的圖片，例如上圖中包含聯繫方式的廣告圖片，最簡單的通過OCR判定圖片包含的文字信息，再過文本反作弊模型。然而如果有圖片噪音、背景疊加等影響，OCR識別率會大幅降低。而色情信息則主要通過圖像算法，圖像識別算法會判定圖片顏色、輪廓等，與標記過的黑庫特徵作對比。

視頻怎相對複雜，如果單純將視頻中每一幀過圖片反作弊策略，那麼1s視頻至少產生24張圖片，一個幾分鐘的視頻就會有數百上千張圖片需要檢測，大型互聯網服務商往往視頻上傳量巨大，在性能和成本上比較難以接收。目前大多會採用抽取部分幀過機器檢測，配合人工審核的方式。

總結來說，要搭建一個能用的內容反作弊系統並不難，但難的是如何在提高併發量、可用性的同時保證較高的準確率。這其中任何一個方向都可以研究的很深，因此架構專家或反作弊策略專家往往可以難倒很高的薪水。最後，也希望包括頭條在內的內容消費產品公司，在內容發作弊上投入更多精力，提高內容質量，弘揚社會正能量。

分享到:

閱讀更多 智趣派 的文章

關鍵字: 談繼移動互聯網抖音