今日头条是如何做推荐算法的?

花冷妍

今日头条的算法一直为外界所诟病,就连人民日报都曾发文点名批评。

在题为《向今日头条等低俗信息传播通道亮红牌》的文章中,人民日报写道:

“算法推荐”的信息有多不靠谱,多么无底线,广大网民特别是孩子们的家长感同身受,甚至伤痕累累。

人民日报指出,今日头条上存在大量低俗信息,甚至垃圾信息。今日头条是以新闻的名义,打着“算法推荐”的幌子,让各种良莠不齐的信息充斥网民手机。只要有粘度、流量,能带来利益就推,什么低俗离奇推什么,这不仅侵占了网民有益阅读空间,还损害了社会道德。今日头条随机整改,清理违规账号。

今年1月11日,今日头条召开分享交流会,首次公开分享了今日头条推荐算法的基本原理。

今日头条资深算法架构师、中国科学技术大学计算机博士曹欢欢在分享会上表示,

算法分发并非是把所有决策都交给机器,我们会不断纠偏,设计、监督并管理算法模型。
希望这次分享能让更多的人理解算法,并共同参与到算法模型的制定中来,以改善算法,更好的为用户服务,让算法为社会创造更大的价值。”

不过,曹欢欢也说,由于现在很难有一套通用的架构模型适用于所有的推荐场景,所以很多公司会做多个算法的组合。

他还透露,以下四种特征将会影响到推荐:

第一,是相关性特征,即评估内容的属性和维度与用户是否匹配。说白了,就是将符合你平时喜好领域的相关内容推荐给你。

第二,是环境特征,即地理位置、时间。

第三,是热度特征,即全局热度、分类热度,主题热度,以及关键词热度等。

第四,是协同特征,指通过用户行为分析不同用户间相似性,比如点击相似、兴趣分类相似、主题相似、兴趣词相似,甚至向量相似,从而扩展模型的探索能力,部分解决所谓算法越推越窄的问题。


全天候科技

不明白推荐量怎么算?这一类的问题回答过很多次了!今天再详细说一下!

什么是推荐量?什么是初始推荐量?如何提高推荐量?这三个是核心问题,互有关联,咱们整体来说!

首先,什么是推荐量?

大家都知道头条会要求文章作者尽量保持固定的领域,然后写的多了会自带一些常用的关键词和标签,比如说你是写文化类的文章,他就会有一个固定的标签——“文化”,然后再根据你所写的那篇文章(比如说你有一天写了一篇关于李白的诗文分析)标题、内容,再提取一定的关键词——“李白”、“诗文”、“唐朝”等等,然后根据这些关键词来寻找对这些内容有兴趣的读者,推荐给他们,这就产生了推荐量!

其次,推荐量的算法和初始推荐量!

刚才解释了什么是推荐量,那么如何计算推荐量的数值?头条根据你文章的关键词寻找到感兴趣的读者,比如说近期有一万人阅读了这一类的文章(不一定是你的文章,这个一万人只是个比方,具体数值不同!),然后会把你的文章推荐给他们,刚开始几百、一两千这样,不会一次性推荐给这一万人,

类似于试水,看看你的文章的点击率、阅读率,来评判你的文章好不好!这就是初始推荐量!

最后,如何提高推荐量?

这里还要说一下算法,我说了他们是有关联的。当你的文章有了初始推荐量,然后根据读者的点击率、阅读率评判文章好坏,如果反应很好(也就是说阅读率、点击率很高),那头条就会加大推荐量,当然不可能一次性就全部推荐完,只是增加,比如说一两千、几千这样,一般会比初始推荐量多很多!这个增加推荐量的过程是很多次的,并非一次。这就是推荐量的完整算法!

那么如何提交推荐量?这就涉及到文章的写作技巧了!不论是标题还是内容,都要新颖、独特,最重要的就是有自己的观点。当然这是笼统的说法,具体的写作技巧这里就不说了,不然写下来太长!可以去找一些相关的文章来学习!

希望我的回答能够帮到您!谢谢!


万物皆明

其实同你一样,我也在网上搜索了许多相关的回答,但是觉得都不是特别的贴切,至于头条的推荐量算法,具体精确的我也说不准确,我只能谈一下自己的感受:

首先,要有一个自己专注的领域,如果持续在一个领域发文,渐渐的你这一类的文章推荐量会呈现震荡上行的走势。虽然一个作者不可能只写一个领域的文章,但要有一个主打领域。

第二,逐渐提高文章的质量。通常而言有思想、有自己见解的文章,推荐量会相对高一些。

以上就是我一点不成熟的小建议,希望对你有帮助。


小张同学自媒体

作为行业先行者的今日头条,主动将算法原则公开,也体现了这种开放态度,这展示了一个商业公司反哺互联网行业的正确姿势,也展现了一家技术平台的责任感。公开独门秘笈也是一种大格局!


分享到:


相關文章: