個性化推薦系統研究熱點—智能推薦與實時服務

這篇文章我們主要介紹和討論的是關於智能推薦服務的技術發展要求和發展中出現的問題,並以今日頭條為例探討智能推薦的發展特徵。

一、場景化以及實時個性化服務的實踐

場景化智能推送作為一種新興的形式,其實現主要依靠三種要素

1、冷數據畫像:性別、興趣、常駐地、職業、收入和年齡段等相對穩定的數據畫像。;

2、溫數據回溯:近期活躍應用、近期去過的地方等具有一定時效性的行為數據。

3、熱數據場景:當前地點、打開的應用等場景化明顯的、稍縱即逝的營銷機會。

個性化推薦系統研究熱點—智能推薦與實時服務

二、場景推送系統

智能場景推送系統需要具備幾個功能:實時識別用戶場景、支持人群篩選、高可用高併發的推送、通知APP開發者的能力。

三、大數據系統

智能推薦中的大數據系統要求構建用戶標籤系統,實現冷熱畫像。做標籤體系的前提是要對各類行為做一些分析和預測模型的建立。同時建立位置定位信標庫和算法,統一設備ID服務。做到海量行為數據實時或者準實時處理,支持系統運營的需求(指標計算和異常發現等)。

四、遇到的一些數據問題

1.設計統一的設備ID,聚合多來源數據,實現畫像的完整性等。

2.基於數據設計請求處理策略,避免系統上線後受髒數據干擾。

3.全鏈路監控及時發現異常點,用數據來運營系統。

4.實時系統中數據傾斜問題。

五、信息流的必然性及其進化(以今日頭條為例)

1.今日頭條簡介

個性化推薦系統研究熱點—智能推薦與實時服務

今日頭條是北京字節跳動科技有限公司開發的一款基於數據挖掘的推薦引擎產品,為用戶推薦信息,提供連接人與信息的服務的產品。由張一鳴於2012年3月創建,2012年8月發佈第一個版本。

2016年9月20日,今日頭條宣佈投資10億元用以補貼短視頻創作。後獨立孵化 UGC 短視頻平臺火山小視頻。2017年2月2日,全資收購美國短視頻應用Flipagram。 2018年8月,CB Insights公佈2018年全球獨角獸企業榜單,今日頭條排名第3位。

今日頭條的特性在於——內容的極度去中心化。在今日頭條,內容生產者發佈的內容,首先要被算法識別和推薦,然後再分發給用戶。在今日頭條中用戶更加註意獲取內容的效率和內容的精準性。如果說微博增強了用戶中心化趨勢,那麼今日頭條則是極度的去中心化趨勢。

個性化推薦系統研究熱點—智能推薦與實時服務

2.今日頭條算法的基礎公式:

Y=F(Xi,Xu,Xc)

今日頭條算法的本質是解決用戶和環境、內容之間的匹配性問題。其基礎維度有三:

第一,內容。

今日頭條是一個全內容平臺,所以在算法運作時候要考慮到內容特徵。

第二,用戶。

每一個用戶都有自己獨特性,但同時在某個維度下又有共同性。所以在算法運作時候要考慮到用戶特徵。

第三,環境。

這是移動信息時代的特點,在不同的場景下,你的閱讀愛好是會有所偏移的。所以在算法運作時候——要考慮到環境特徵。

結合這三個維度,算法會給出預判,預測該內容是否能對某一情景下的某一用戶產生正面反饋。其實,不只是今日頭條,其他內容平臺都是這個模式。

個性化推薦系統研究熱點—智能推薦與實時服務

3·四個推薦特徵:

第一·匹配性特徵:

即然算法是用來解決內容和用戶匹配性的,那麼精準的內容必然會獲得頭條更多的推薦量。那麼關鍵詞、分類和主題的選擇就顯得尤為重要。

第二·環境特徵:

即然算法是用來解決環境和用戶匹配性的,那麼貼合時間點、貼合地理位置、必然會獲得頭條更多的推薦量。

第三·熱度特徵:

所有用戶都在關注的熱點會被多推薦,一個類別下(比如娛樂、體育)大熱的內容會被多推薦、一個主題下(比如說:NBA季後賽)大熱的內容會被多推薦、一個關鍵詞下(詹姆斯)大熱的內容會被多推薦。

第四·相似性特徵:

通過用戶行為分析不同用戶間相似性,從而提高推薦的效率和準確性。


分享到:


相關文章: