今日頭條是如何做推薦算法的?

花冷妍

今日頭條的算法一直為外界所詬病,就連人民日報都曾發文點名批評。

在題為《向今日頭條等低俗信息傳播通道亮紅牌》的文章中,人民日報寫道:

“算法推薦”的信息有多不靠譜,多麼無底線,廣大網民特別是孩子們的家長感同身受,甚至傷痕累累。

人民日報指出,今日頭條上存在大量低俗信息,甚至垃圾信息。今日頭條是以新聞的名義,打著“算法推薦”的幌子,讓各種良莠不齊的信息充斥網民手機。只要有粘度、流量,能帶來利益就推,什麼低俗離奇推什麼,這不僅侵佔了網民有益閱讀空間,還損害了社會道德。今日頭條隨機整改,清理違規賬號。

今年1月11日,今日頭條召開分享交流會,首次公開分享了今日頭條推薦算法的基本原理。

今日頭條資深算法架構師、中國科學技術大學計算機博士曹歡歡在分享會上表示,

算法分發並非是把所有決策都交給機器,我們會不斷糾偏,設計、監督並管理算法模型。
希望這次分享能讓更多的人理解算法,並共同參與到算法模型的制定中來,以改善算法,更好的為用戶服務,讓算法為社會創造更大的價值。”

不過,曹歡歡也說,由於現在很難有一套通用的架構模型適用於所有的推薦場景,所以很多公司會做多個算法的組合。

他還透露,以下四種特徵將會影響到推薦:

第一,是相關性特徵,即評估內容的屬性和維度與用戶是否匹配。說白了,就是將符合你平時喜好領域的相關內容推薦給你。

第二,是環境特徵,即地理位置、時間。

第三,是熱度特徵,即全局熱度、分類熱度,主題熱度,以及關鍵詞熱度等。

第四,是協同特徵,指通過用戶行為分析不同用戶間相似性,比如點擊相似、興趣分類相似、主題相似、興趣詞相似,甚至向量相似,從而擴展模型的探索能力,部分解決所謂算法越推越窄的問題。


全天候科技

不明白推薦量怎麼算?這一類的問題回答過很多次了!今天再詳細說一下!

什麼是推薦量?什麼是初始推薦量?如何提高推薦量?這三個是核心問題,互有關聯,咱們整體來說!

首先,什麼是推薦量?

大家都知道頭條會要求文章作者儘量保持固定的領域,然後寫的多了會自帶一些常用的關鍵詞和標籤,比如說你是寫文化類的文章,他就會有一個固定的標籤——“文化”,然後再根據你所寫的那篇文章(比如說你有一天寫了一篇關於李白的詩文分析)標題、內容,再提取一定的關鍵詞——“李白”、“詩文”、“唐朝”等等,然後根據這些關鍵詞來尋找對這些內容有興趣的讀者,推薦給他們,這就產生了推薦量!

其次,推薦量的算法和初始推薦量!

剛才解釋了什麼是推薦量,那麼如何計算推薦量的數值?頭條根據你文章的關鍵詞尋找到感興趣的讀者,比如說近期有一萬人閱讀了這一類的文章(不一定是你的文章,這個一萬人只是個比方,具體數值不同!),然後會把你的文章推薦給他們,剛開始幾百、一兩千這樣,不會一次性推薦給這一萬人,

類似於試水,看看你的文章的點擊率、閱讀率,來評判你的文章好不好!這就是初始推薦量!

最後,如何提高推薦量?

這裡還要說一下算法,我說了他們是有關聯的。當你的文章有了初始推薦量,然後根據讀者的點擊率、閱讀率評判文章好壞,如果反應很好(也就是說閱讀率、點擊率很高),那頭條就會加大推薦量,當然不可能一次性就全部推薦完,只是增加,比如說一兩千、幾千這樣,一般會比初始推薦量多很多!這個增加推薦量的過程是很多次的,並非一次。這就是推薦量的完整算法!

那麼如何提交推薦量?這就涉及到文章的寫作技巧了!不論是標題還是內容,都要新穎、獨特,最重要的就是有自己的觀點。當然這是籠統的說法,具體的寫作技巧這裡就不說了,不然寫下來太長!可以去找一些相關的文章來學習!

希望我的回答能夠幫到您!謝謝!


萬物皆明

其實同你一樣,我也在網上搜索了許多相關的回答,但是覺得都不是特別的貼切,至於頭條的推薦量算法,具體精確的我也說不準確,我只能談一下自己的感受:

首先,要有一個自己專注的領域,如果持續在一個領域發文,漸漸的你這一類的文章推薦量會呈現震盪上行的走勢。雖然一個作者不可能只寫一個領域的文章,但要有一個主打領域。

第二,逐漸提高文章的質量。通常而言有思想、有自己見解的文章,推薦量會相對高一些。

以上就是我一點不成熟的小建議,希望對你有幫助。


小張同學自媒體

作為行業先行者的今日頭條,主動將算法原則公開,也體現了這種開放態度,這展示了一個商業公司反哺互聯網行業的正確姿勢,也展現了一家技術平臺的責任感。公開獨門秘笈也是一種大格局!


分享到:


相關文章: