小编: 今日头条,大家公认的一个超级大流量平台,其最大的特点就是文章的智能推荐系统
今日头条,大家公认的一个超级大流量平台,其最大的特点就是文章的智能推荐系统。
但是,有些人在今日头条文章动辄几十万、几百万,甚至上千万阅读,但有些则只是几十、几百的流量。
除了内容本身的质量以及账号区别之外,最大的关键就在于其算法推荐规则。搞懂今日头条文章推荐规则,是在这里进行精细化运营的核心关键。
那么,今日头条海量文章推荐的机制是怎么样呢?为什么有的文章展现量几百万,有的却只有几十几百?对于文章的推荐机制我们又能做些什么?
首先在说文章推荐规则之前,另一个机制大家一定要先了解,那就是今日头条的消重机制。
你在头条号发布的内容,在通过审核和进入推荐系统之间,还有一道难关,那就是下面要说的消重机制。
我们都知道,在互联网上,同样的文章、图片、视频往往会被很多其他媒体转载或复制。
如果我们在百度搜索一篇内容,经常会得到多个网址。所以,我们一般需要自己筛选和判断,哪个网址更权威,更有价值,再点击去访问就可以了。
但是今日头条不一样,它是基于算法推荐给用户的。所以一定要保证不能连续给用户推荐了几篇相似的内容,否者用户体验会非常差:怎么老是给我推荐一样的内容,什么鬼系统!
● 如果存在,那么这篇内容的来源是否是最权威、最有价值、是否最有可能是原创来源?
那么,消重就是指对重复、相似、相关的文章进行分类和比对,使其不会同时或重复出现在用户信息流中的过程。
今日头条首先会通过消重机制来决定同样主题或内容的文章是否有机会被推荐给更多用户。
如果让人来判断,可能就要逐字逐句地把文章读完才能判断得出来。通过计算机这样去判断当然也是可以的,不过,当每天需要处理的内容达到十多万篇次的时候,这么做即使对于计算机来也太麻烦了。
今日头条的做法是,通过系统的计算,一篇文章的文本、标题、图片等都是可以转换成一串数字代码,也就是信息指纹。这就像我们每个人的身份证,如果两个人的身份证号码一模一样,那么就可以肯定这是两个一样的人。
而文字信息的「身份证」也能起到类似的作用,对于图片、视频等信息形式,原理也是类似的。这种算法模型这里就不多说了,重点来看影响消重的关键项。
除了内容消重的规则外,头条号平台上实际上还存在这一些针对内容之外的消重规则:
之所以要对具有相同的标题或者预览图片的内容进行消重(哪怕它们的内容并不相同),是因为,假如用户没有点击内容详情页,他是不知道内容写的什么的。
那么,光看标题和预览图就是系统把两篇一样的内容重复推荐给了自己,可想而知这样的浏览体验是很糟糕的。
况且,很少有人愿意连续点击几篇看上去一模一样的内容,因此这样的推荐也很少起效果。
你肯定对这样的景象不陌生:每当有某个社会热点事件或者话题出现的时候,媒体、自媒体、KOL们一拥而上,竞相报道事件细节或者发表观点,让你的微博、朋友圈被有关这件事的种种内容“刷屏”。
但是,对于用户来说,需要的其实并不是反复看到相同的信息,如果有足够优质的报道或者观点的话,其实看有限的几条就够了。
相似主题的消重其实和内容的消重其实原理是一样的,是对文章中全部的关键词(也就是我们常说的标签)进行统计并计算信息指纹,当然也可以对其中与话题相关的关键词进行统计分析。
一旦系统发现了可能对某篇内容感兴趣的用户,那么系统会自动把具有同样「信息指纹」的内容或话题中,经过挑选最优的一篇推荐到用户的信息流。
这里,木木重点说一下相似主题消重,这个与我们是最最最相关的。因为头条要追热点,基本是大家公认的事实。
因为有这个相似主题消重,那具有相同「信息指纹」的话题或热点,几乎不可能获得推荐了。这就是为什么很多时候我们的热点文章在头条号会推荐惨淡。
一个热点再热,用户的兴趣也是有限的,特别是如果你的热点角度没什么区别,平台已经推荐过相似内容了,那系统是不愿意再推荐的,因为用户他已经懂了,再推荐就是打扰了!
所以说你追热点的角度一定要差异化,写热点文章有很多切入点,你可以把一个热点进行拆分关键词,每一个都可以是一个很好的切入口,这就是所谓的“同主题异角度”。
与此同时,你的标题也要明显的差异化,因为这个热点标签的提取统计,主要来自于标题,而后才是内容。并且,在一个大热点下,用户想知关于热点的各个方面,所以标题角度也要明显。
如果不能确定自己创作的角度足够独特,及自己的内容足够优质,那么就不要随意地追逐热点,免得做了无用功。
我们知道,文章的阅读量很大程度上取决于系统的推荐量,那么一篇文章的推荐量,是由什么因素决定的呢?
7)站外热度:在互联网上关注度高的线)发文频率:经常发文,保持活跃很重要。
不过这些都是一些表象的东西,这里更系统和深入的说一下,只有知道本质了我们才能更好的做好这些。
今日头条的文章识别系统会对文章进行特征识别,从而判断文章讲的是什么类型和领域的内容。特征识别的维度有很多,在这里我们重点解释「关键词」。
系统会根据文章中出现的频率,提取出一些词语作为关键词,关键词的判定原则有二:
如一篇体育类文章内容关于某场足球比赛,那么文章可能会出现的高频词就包括球员名字、足球术语或技巧等,如「C 罗」、「射门」、「突破」。
作者撰文时常用到的虚词、转折词等出现频率也很高,但它们不会作为关键词被提取出来,因为这些词在文章中是普遍存在的。
系统判定出一篇文章的关键词后,会将这些关键词与文章分类模型进行比对,命中哪些分类词库关键词的比例大,文章即被打上该分类的标签。如,一篇文章排名靠前的关键词为「C 罗」、「射门」、「西甲」、「马德里」,那么该篇文章可能会被打上「足球」、「国际足球」、「西班牙」等标签,完成对文章的初步认知。
而除文章正文关键词识别外,系统还会对标题进行关键词的识别和分类比对。因此,在标题中露出具代表性的实体词非常重要。
每个人的阅读兴趣都是大不相同的,个性化推荐机制要做的事情就是——让每位用户看到可能感兴趣的内容。
这种精准推荐,是建立在机器对每位用户都有充分认知的前提下的。在系统里面,每位用户实际是由大量数据构成的,用户的阅读兴趣就藏在这些数据中:
性别、年龄、所处地理位置(城市或地区);还有使用机型、授权账户(如微博、微信等)、手机上经常使用的其他 App 等。
用户阅读过的文章分类和关键词;相似类型用户还喜欢阅读的其他文章类型;用户在今日头条客户端主动标记「不感兴趣」的实体词或文章类型。
根据以上数据,系统对用户的阅读兴趣就能有个基本的判断。然后通过对数据的处理,每位用户将被系统打上各种标签。
如一个用户阅读的文章中关键词排名靠前的是:C罗、皇家马德里、欧洲杯、小米、魅族、苹果。
那么,这位用户可能被打上「足球、「皇马」、「科技」、「手机」、「米粉」等标签。不同的用户会被打上不同的标签。
最后,当一篇带有「C 罗」、「足球」标签的文章在进行推荐时,系统会将其自动匹配给带有「C 罗」或「足球」标签的用户,这便是推荐引擎的个性化推荐。
系统先通过数据来来给内容和用户打上各种标签,然后通过算法将内容标签跟用户标签进行匹配,接着根据第一批推荐情况,决定后续的推荐量,这个下面说。
为让受欢迎的内容被更多用户看到,不受欢迎的内容不占用过多推荐资源。头条号文章在推荐时,会分批次推荐给对其感兴趣的用户。
文章首先会被推荐给一批对其最可能感兴趣的用户(这批用户的阅读标签与文章标签重合度最高),这批用户产生的阅读数据,将对文章下一次的推荐起到决定性作用。
数据包括点击率、收藏数、评论数、转发数、读完率,页面停留时间等,其中,点击率占的权重最高。
文章的首次推荐,如果点击率低,系统认为文章不适合推荐给更多的用户,会减少二次推荐的推荐量;如果点击率高,系统则认为文章受用户喜欢,将进一步增加推荐量。
以此类推,文章新一次的推荐量都以上一次推荐的点击率为依据。此外,文章过了时效期后,推荐量将明显衰减,时效期节点通常为24小时、72小时和一周。
因为这种扩大推荐的机制,你想获得更多的阅读量,就必须努力把各维度阅读数据(点击率、用户阅读时间、收藏数、评论数、读完率等)维持在高位水平。这也就上面官方的一些标准。
其中,至关重要的当然是点击率,也因此,标题和封面图的重要性便不言而喻。这也是今天注意力稀缺时代,文章获得好的传播的关键要素。
文章所对应的标签,直接决定了匹配的相对应标签的用户量。有的标签本身就对应很大体量的用户,而有的标签对应人群很小,就算点击率再高,天花板也很低。
这就是为什么很多专业性文章阅读不高,而情感鸡汤、娱乐八卦、社会新闻的推荐一般会很高。这也是为什么大家都会去追热点,因为热点标题对应的用户群体非常大。
所以说,我们选题,包括文章标题以及内容里面的关键词使用,一定要基于用户量大的标签,这样可以获得更多的推荐量。
之前今日头条官方就发过最受欢迎的一些标签,这些都是一级标签,你有没有经常使用?
而且,今日头条还专门推出了热词分析功能,帮助大家找到不错的标签。利用热词分析功能可以大大增加系统推荐量,提高文章的阅读量。
另外,今日头条是有文章分类的,在你的文章类型的大类下,手机查看相关文章,底部都有对应文章的标签,多收集这些标签,积累自己所属行业的标签库。
常有作者抱怨自己的某篇文章推荐效果不好,或者对自己的文章阅读量不稳定感到焦虑。
前面我们知道,文章的阅读量由系统推荐量直接决定,而推荐量又取决于上一轮推荐的点击率。
因此单篇文章推荐效果不好,原因无外乎三大类:点击率低、推荐量低、阅读量低。
前面说了,文章推荐至关重要的是点击率,新一次的推荐量都以上一次推荐的点击率为依据。
为了提升用户体验,机器会减少那些不受欢迎的内容(即点击率低的内容)的推荐量,如果点击率持续走低,推荐量也相应地持续减少。
你是体育类帐号,这一次却发表了娱乐类内容。对于这种不属于帐号擅长领域的文章,系统需要重新识别分类再进行推荐,这在一定程度上会延长推荐时间,不能保证在规定时效内,推荐给相应的用户。
木木给大家一个方法,在找选题、写文章、定标题时,可以先通过今日头条媒体实验室搜索一下选题的关键词来判断热度,还可以查看相关关联词。
比如,我们将“张馨予”和“范冰冰”这两个词进行一天内热度趋势的比较。会发现“范冰冰”的关注热度是高于“张馨予”的。
那么,如果我要写的是关于这二个人的一个话题文章,那我会不管是在标题还是在内容中着重多出现“范冰冰”这个关键词,这就会增加推荐量,也会更可能受到用户关注,从而提高点击率。
所以说,今日头条的文章发布以及标题选择也是可以科学运营的,不一定只是盯着自己的号,也可以看看大环境是怎样的。
如果潜在的用户群实在过小,机器将很难挖掘到潜在用户,推荐量自然高不了。而潜在用户群过小有如下原因:
这个上面已经说了,有的文章标签本身就对应很大体量的用户,而有的标签对应人群很小,就算点击率再高,推荐量也不会高到哪去。所以,一定要有意识的选择或加入用户量大的标签。
同一领域或话题相似内容过多,出现了供过于求的现象。如,关于当下热点话题的谈论,受众虽然足够多,但是内容供给总量实在庞大,相应地每一篇内容得到的推荐量也就比较少。
这一点很容易理解,说白了就是内容扎堆、僧多粥少。那么系统就只有2个选择,要么只推荐其中一部分内容,要么都推荐但是推荐量会少,因为不能重复给1个用户推荐1样的内容。
而就算内容不是供过于求的,也会有消重机制的影响,已经有推荐过相似的内容就不会再过于推荐了。
文章非原创或者没有在头条号首先发布,再或者和其他话题相似度过高,文章都可能会被消重,从而影响推荐量。
时效性短的文章,实际推荐时间自然也短,而短时间内可能将无法获得较多的推荐量。
前面讲了,文章是有一个时效期的,过了时效期文章的推荐量将明显衰减,时效期节点通常为 24 小时、72 小时和一周。
我们也可以在选择话题的时候,先使用热词分析功能,大致判断一下热点的持续时间。
基本上,我们说的提高点击率+读完率、文章分类明确、文题一致、提高内容质量、账号垂直度高、做好各种互动数以及订阅数、扩大站外热度、保持发文频率等都是为了更好的做好推荐量。
文章阅读量低,与点击率和推荐量有关。同时,阅读量低也反过来会影响点击率和推荐量。
在推荐量增长到一定数量级之前,即使点击率较高,文章阅读量也不会高,因为内容并没有得到大范围的验证。在后续的推荐中,如果推荐量持续攀升,阅读量可能会稳步增长。
而如果推荐量已经足够高,阅读量仍然较低,很可能是由于文章的点击率较低。这就需要从点击率着手。
其实,在木木看来,主要是前2項最重要,至于阅读量,推荐低就主攻推荐量,点击少就集中点击率,自然就解决问题了。
总而言之,大家要明白,今日头条上的文章是经过发布——审核——识别消重——推荐——点击阅读——用户反馈的过程,知道这个后大家才能根据每个环节各个击破。
特别需要注意文章以及用户对应标签,文章推荐量和它有点,点击率和它有关,阅读反馈也和它有关,不重视不行。
最后,祝大家通过海量流量的今日头条,获得海量的推荐量,再获得海量的阅读量。
当前网址:http://www.sx-news.com/yule/2018-11-11/50063.html
免责声明:本文仅代表作者个人观点,与陕西新闻网无关。其原创性以及文中陈述文字和内容未经本站证实,对本文以及其中全部或者部分内容、文字的真实性、完整性、及时性本站不作任何保证或承诺,请读者仅作参考,并请自行核实相关内容。