个性化推荐的基础,精准获取标签的方法解析

个性化推荐的基础,精准获取标签的方法解析

首先我们都知道标签本身会有很多分类,但是从它的实现规则来看,大致可以分成以下几类:

个性化推荐的基础,精准获取标签的方法解析

(1)基于统计类的标签

顾名思义,这类标签是可以从用户注册、用户访问、消费类数据中统计得出,是最为基础的标签类型,例如,性别、城市、App 使用时长、周均启动次数、月均消费金额等字段构成了用户画像的基础。

(2)基于规则类的标签

该类标签基于用户行为及确定的规则产生,在实际开发标签过程中,该类标签的规则由运营人员和数据人员共同协商确定。如,距今 90 天内交易次数 > 3,是“交易活跃”标签的定义和口径;连续 12 个月内飞行航段 > 20 ,是“常旅客”标签的定义和口径。

(3)基于挖掘类的标签

该类标签为概率模型,概率是介于 0~1 之间的数值,需要通过算法挖掘产生。例如,根据一个用户的行为习惯判断是男性还是女性,根据一个用户的消费习惯判断其对某商品的偏好程度。

需要注意的是数据源的梳理和基础规则的应用是应用挖掘类标签的前提。如果企业的数据源没有做规则,基础没打好,挖掘类标签可以暂时不考虑。因为建立规则仿佛在搭建一个小阶梯,如果这个阶梯搭好,证明你的数据质量和存在应用提升空间,你再往上提一阶是比较合理的方式,因为这里会涉及到成本的投入和人员的应用能力,这是个循序渐进的过程,包括我们给客户服务的时候都会给他强调存在阶梯式递进的过程。

另外,图中的用户自然属性、用户交易数据、用户资产数据、用户行为特征、第三方来源数据是基于数据源或具体的业务场景做的标签分类,事实上,最终呈现的标签,一般都是以业务视角的,标签与应用场景,以及统计的属性源会都有关联。之所以这样做,是因为这样的标签是以用户视角定义的,让用的人知道这个标签代表了什么含义,而不是了解通过什么方式抽取的。

更多干货和案例,可以关注“神策数据”公众号了解~

个性化推荐的基础,精准获取标签的方法解析



分享到:


相關文章: