機器如何讀懂你的內容,今日頭條推薦機制大揭祕 -公開課筆記

2019年7月1日的第二期頭條公開課講了12個課時,共涉及到9個方面的知識講解。現在經過重複學習,將公開課的筆記做如下分享,希望我們能夠共同應用。

一、第二期頭條公開課課程目錄

機器如何讀懂你的內容,今日頭條推薦機制大揭秘 -公開課筆記

頭條公開課第二期課程目錄

二、《機器如何讀懂你的內容,今日頭條推薦機制大揭秘》

關鍵詞:基本原理、實操技巧。

機器如何讀懂你的內容,今日頭條推薦機制大揭秘 -公開課筆記

目錄

(一)推薦原理解析

推薦系統的本質就是從一個巨大的內容池裡,給當前的用戶匹配出最感興趣的幾篇文章,這個內容池有幾十萬上百萬的內容,涵蓋文章、圖片、小視頻、問答等各種各樣的體裁,再給用戶匹配內容的時候,主要依據為內容、用戶、用戶對內容感興趣的程度。

1.系統如何理解我們創作的內容?-內容刻畫

主要依託於關鍵詞識別技術,根據關鍵詞將內容進行粗分類,再根據細分領域的關鍵詞對分類進行細化。關鍵詞提取的時候依照高頻詞規則和獨特性規則,根據系統模型的建造原理,我們通過儘量不使用非常規詞,對於名人/地名等用全稱不用縮寫,在標題中最好漏出具有代表性的名詞和代詞。

2.系統如何理解用戶的需求?-用戶刻畫

具體通過用戶瀏覽的歷史文章、身份標籤、環境特徵來了解用戶關心的類別和主題,識別關鍵詞和來源,以興趣標籤、職業、 年齡、性別、機型、工作、旅遊、娛樂場所、休息等對用戶聚類和各種垂直興趣特徵進行對用戶的刻畫,系統根據這些內容就可以刻畫出一個例如正在旅遊的關注足球、汽車、騎行、探險的位於20~35歲之間的男性。

3.系統如何理解用戶對內容的興趣?-興趣刻畫

在用戶註冊或者使用時會識別出用戶的年齡、性別和地域等基本信息,通過訂閱的賬號、歷史瀏覽的文章和關注的話題等行為信息,以及閱讀行為、用戶聚類和用戶標記等閱讀興趣,通過這三方面來刻畫出用戶對內容的興趣。

推薦算法的本質是根據文章特徵、用戶特徵、環境特徵擬合一個用戶對內容滿意度的函數,它會估算對每一篇文章的點擊概率,然後從幾十萬上百萬的內容池裡將所有的文章按照興趣由高到低的排序,前10名的文章就會被推薦到用戶的手機上進行展現。

(二)一篇文章的推薦歷程

當大家發表完一篇文章、拍完一個視頻後就會生成一個內容,在整個系統裡就會經歷的旅程是,內容審核➡️冷啟動(加權推薦)➡️正常推薦➡️複審,通過用戶的點擊、評論、舉報等行為觸發複審流程作出繼續推薦或打壓處理的行為。

機器如何讀懂你的內容,今日頭條推薦機制大揭秘 -公開課筆記

一篇文章的推薦歷程

1.內容審核

初審的目的是為了判斷這篇文章有沒有違反國家相關法律的風險,機器模型判斷風險級別,根據不同的風險級別分發給不用的審核人員進行處理,在機器和人工的配合下,快速的通過初審,立刻呈現在用戶面前。

2.冷啟動

冷啟動是個推薦上的概念,文章在發佈初期,系統會根據相關數據進行推薦的時間段和提高文章分發加權推薦,觀察最早幾千次展現,根據用戶的點擊、點贊、分享、評論判斷喜歡該文章的人群,在經歷了幾千次的展現後,系統會認為給足了冷啟動的機會,就會撤銷對文章的加權,文章是否會“火”起來,就看文章的創作實力了。

3.正常推薦和複審

通過了冷啟動的文章,會通過最基礎的推薦效果,如果文章的推薦效果好,系統會將這篇具有潛質的文章繼續擴大推薦給一萬個、幾萬個、十萬個用戶,如果文章的閱讀效果不好,系統會對文章的推薦量會衰減。但如果出現點擊率特別高,但與此同時負面評論與舉報又特別多的數據異常的現象,這篇文章就會再次進入審核流程,也就會啟動複審流程。對複審流程中的文章存在標題黨、封面黨、低俗、虛假這些問題,系統就會停止這些文章的推薦。

(三)推薦中的常見問題

1.為什麼推薦流量“不穩定”?

文章的“消重策略”是針對於同一個話題,展現出了幾百到幾百萬甚至更多的推薦的機制,在多篇相似的文章中,會優先推薦原創文章。根據以下三個小提示,可以避免“消重策略”,首先堅持優質原創,其次面對熱點謹慎追逐,最後撰寫的文章體現鮮明的個人特色。

“同類文章的擠壓”系統在同類文章中選取一篇最適合的推送給用戶,每一篇文章的具體推薦量既取決於當時的具體環境,也取決於當時整個內容池裡面其他文章的表現。

2.為什麼文章推薦一半就不推薦了?

文章一旦出現了質量問題,在嚴格的複審流程中,例如過度誇張、故意製造懸念、無中生有、歪曲事實、題文不符、低俗引導等的標題黨;封面圖不清晰、存在惡意引導等情況的封面黨和低俗黨;文章違背科學常理,描述未被證實,或與已發生事實相悖的事件情節等虛假信息;文章中包含推廣信息的等情況,系統在複審的時候將會不再推薦該文章。另外粉適量,閱讀量,當時的環境都會影響文章的推薦量。

(四)如何獲得更高推薦

面向用戶需求來創作,寫高質量的文章,追求用戶的價值,經調研用戶喜歡文章視角新穎,觀點鮮明有態度的文章,並且希望文章的內容足夠充實,帶來信息增量,可以讓用戶學到新的知識或者得到有用的信息。此外堅持原創首發,平臺對於原創首發的文章會有傾斜式的更多推薦量。

文章的視覺體驗也是非常重要的,需要優化文章的展示形式,從視覺上吸引用戶的目光,確保標題和封面圖對用戶有一定的吸引力,也有一定的代表性,可以表達清楚文章的內容。圖文並茂,善於用於排版工具等。

機器如何讀懂你的內容,今日頭條推薦機制大揭秘 -公開課筆記

通過對系統的瞭解,我們需要進行實際操作,以便創作出更好的文章。


分享到:


相關文章: