個性化推薦的基礎,精準獲取標籤的方法解析

個性化推薦的基礎,精準獲取標籤的方法解析

首先我們都知道標籤本身會有很多分類,但是從它的實現規則來看,大致可以分成以下幾類:

個性化推薦的基礎,精準獲取標籤的方法解析

(1)基於統計類的標籤

顧名思義,這類標籤是可以從用戶註冊、用戶訪問、消費類數據中統計得出,是最為基礎的標籤類型,例如,性別、城市、App 使用時長、周均啟動次數、月均消費金額等字段構成了用戶畫像的基礎。

(2)基於規則類的標籤

該類標籤基於用戶行為及確定的規則產生,在實際開發標籤過程中,該類標籤的規則由運營人員和數據人員共同協商確定。如,距今 90 天內交易次數 > 3,是“交易活躍”標籤的定義和口徑;連續 12 個月內飛行航段 > 20 ,是“常旅客”標籤的定義和口徑。

(3)基於挖掘類的標籤

該類標籤為概率模型,概率是介於 0~1 之間的數值,需要通過算法挖掘產生。例如,根據一個用戶的行為習慣判斷是男性還是女性,根據一個用戶的消費習慣判斷其對某商品的偏好程度。

需要注意的是數據源的梳理和基礎規則的應用是應用挖掘類標籤的前提。如果企業的數據源沒有做規則,基礎沒打好,挖掘類標籤可以暫時不考慮。因為建立規則彷彿在搭建一個小階梯,如果這個階梯搭好,證明你的數據質量和存在應用提升空間,你再往上提一階是比較合理的方式,因為這裡會涉及到成本的投入和人員的應用能力,這是個循序漸進的過程,包括我們給客戶服務的時候都會給他強調存在階梯式遞進的過程。

另外,圖中的用戶自然屬性、用戶交易數據、用戶資產數據、用戶行為特徵、第三方來源數據是基於數據源或具體的業務場景做的標籤分類,事實上,最終呈現的標籤,一般都是以業務視角的,標籤與應用場景,以及統計的屬性源會都有關聯。之所以這樣做,是因為這樣的標籤是以用戶視角定義的,讓用的人知道這個標籤代表了什麼含義,而不是瞭解通過什麼方式抽取的。

更多幹貨和案例,可以關注“神策數據”公眾號瞭解~

個性化推薦的基礎,精準獲取標籤的方法解析



分享到:


相關文章: