先说一下场景吧,其实很多年前就有了这些东西,只是还没有上升到推荐算法这个高度吧。
场景1:Feed(信息流)
也就是像头条、微博、知乎的首页一样,刷不完的信息,而且刷着还挺符合自己的兴趣爱好的,于是就放不下了。
场景2:猜你喜欢
这个也不陌生吧,比如淘宝、网易云音乐、懒人听书、腾讯电影,几乎各行各业都在猜你喜欢什么。
猜你喜欢,也可以衍生成,猜你需要,猜你想听,猜你想看,只是统计算法维度的不同而以。
这里想重吐槽一下淘宝,总感觉淘宝少了一个订单的用户购买维度,因为他总是在我购买了一件东西后给我推一样内容的商品
(PS:是不是傻呀?)
我都买了,你还推出一些比我买的还要低价的同商品给我,你不是找骂吗?
快点改成猜我还想要吧。
场景3:相关推荐
这个大大小小的网站都有吧,最简单的,就是每个文章下面都加了一些其它的文章标题,名为相关内容。
起初他就是一个关键词匹配,现在有了算法,需要的维度就更多罢了。
场景4:热门推荐
这个和feed流有点相似,但有些不同,可单独拿出来,是因为热门推荐的机制与当事人没有关系,它的机制属性或者数据全来源于外部。
比如:外部收集到的热点话题,全站用户的点赞、评论、分享等在一定时间内的形为数据而进行推荐演变出来的。
典型的有微博话题排行、推荐电影等等。
互联网里大部分时间看到的是这四种。
其中以首页的feed流计算是最难的,毕竟是首页,而且占据了全版面,大部时间都拉用户停留的页面。
所以以我所学,再次分析一下信息流吧。
信息流推荐机制有哪些?
信息流(Feed流)的推荐算法可以有推和拉两种形式,当然也可以是推拉结合一起。
什么是推流?
“推”简单一点说就是,平台的主动形为,把信息按某些算法的结果主动的推送给到用户。
像facebook、朋友圈就是以推为主,通常他们都是有强社交关系或者是粉丝社交关系,并且有一定的时间效应。比如我(微信:半打啤酒)发出一条朋友圈,我的512个好友就会收到我的信息(看不看是另一码事)。
什么是拉流?
“拉”简单一点理解,用户主动的刷新Feed流,接到的信息,这些可能时效性不是那么好,比较知识类的内部会偏向于拉的方式。
如知乎、头条、等等。他们的特点就是按强兴趣对内容和用户进行匹配,对及时性要求不高。
推拉结合
还有就是推拉结合的方式了,举例特点:微博。
微博是弱关系社交媒体,我们通常会关注很多的大V群体,所以当我们关注的大V发信息了,我们通常会第一时间收到,并且会插入到列表里,然后再是其它推荐的信息。
当然按时间过期的原则,部分的信息在你长时间不打开微博情况下,也会消失不见。
除了这种主动推的方式,剩下的就是拉的方式了,我们拉一下刷新,刷出了推荐给我们的内容。
通常我们几乎人人都知道他们是按兴趣来推送的,但我们不知道他们是如何算的,
但做为一个产品经理,我们不一定要知道它是通常什么公式计算的,但我们必须知道它的整个运行原理。
如何知道用户的兴趣爱好
我们拿头条来举例吧。
头条有海量的资讯内容,如何做到每个用户看到的都是自己喜欢的呢?
如何分析用户的兴趣?
总体来说,就是
当用户进入APP时,并不是空白的,一般软件,会通过匹配外部数据公司买来的数据,例如:淘宝的数据、支付宝的数据、微信的数据等等其它APP的数据来给用户做初始的画像,当然还可能有自身的数据,如记录你手机的行为数据,你打开别人的APP的时间,哪开了哪些APP,再就是包括了你注册时提交的性别、年龄、头像、地区、甚至是兴趣分类的数据,都是用来做为你的第一用户画像。
如果他真是拿你没办法,没有外面数据,你也不填写数据,还有一个很重要的推荐算法的方式,叫协同算法。
也会通常贯穿一整个推荐信息流的方法。
就是利用你的社交关系,以及与你同兴趣、同年龄、同爱好、等相同点,看看他们都喜欢什么,然后也同样的开始推送给你。
然后它可能就说它懂你了,然后就给你推信息。
然后如果推送的一些信息有中了你的爱好,那么它就开始一个全新的学习闭环。
记录你的信息,如:你的行为数据、社交关系、甚至你的聊天内容,然后开始匹配内容信息,筛选内容信息,进行重新排列,再推送到你。
如何对筛查出优质内容呢
当然这所有的推荐算法是对用户的兴趣进行筛查,同事的,对内容的筛查同样的重要。
如何把重要有趣的内容挑出来?
基本的闭环其实,还是不停的试,试着试着就出来了,试出内容是否高质量,试出作者是否真的有能力。
通常会先用AI智能筛选一遍,再人工抽查一下,然后再小试一批用户,数据效果不好就停,好的话就再推,推上一定的时间,就是好的内容。
当我们了解了所有的原理后,我们接下来就要想想如何分期一步步的完善这样的一个系统了。
今天先说到这里,下一次心血来潮我再把我做的一个推荐系统写一下。
閱讀更多 醉墨 的文章