百度飓风算法即将到来,一家算法的命中率范围揭晓

文章来源:优帮云SEO 2020-06-04

近日百度推出飓风算法,严厉打击不良收藏站。不幸的是,许多网站被招募,通宵交通恢复到解放前。我研究了百度和谷歌的文档,并详细定位了算法的命中率范围。

让我们来看看百度的官方公告,内容如下:

百度搜索近推出了飓风算法,旨在打击以不良收藏为主要内容来源的网站。同时,百度搜索将彻底清除索引数据库中不良的收藏链接,为高质原创内容的展示提供更多机会,促进搜索生态的良性发展。飓风算法会定期产生惩罚数据,并根据情况随时调整迭代次数,体现百度搜索对不良收集的零容忍度。如果高质量的原创站点发现站点索引大大降低,流量大大减少,可以在反馈中心进行反馈。

从官方文件来看,飓风算法的攻击目标是网站,而不是网页;它主要针对以不良收藏为主要内容来源的网站,而不是所有包含不良内容的网站。

不良收藏内容一般是指不花时间、精力、专业能力、手工整合,或对用户没有附加值的内容。

本部分包括以下类型:

注意几个要点:主要内容、不良收藏和附加值。

该组的一些朋友还问,为什么有些网站也会被收集,但没有受到影响,比如一个医生或一个浪。其实,只要达到了某一个关键点,就不是不好的收藏。这一点的关键是为用户带来附加值。

增值有两种:网站增值和内容增值。这时,你可以引用百度搜索技术博客“谈论网页价值”中的一段话:

有人发表了一篇关于新闻事件的原创博客,然后被新浪转载到新闻频道。就描述而言,这是一种重复。但这种重复只是主要内容的重复。一方面,其转载带来了访问速度、稳定性等方面的增益,后期检索用户可以使用“新闻事件+新浪”来检索该新闻。这可以称为站点增益。另一方面,它在转载的过程中可能会改变页面的标题,根据其受众的不同,转载页面上可能会有更多有价值的评论和回复,也可能有其他相关事件的新闻链接。这些可以称为内容增益。所以即使主题内容没有变化,新浪的转载也是有价值的,而且其稀缺性也很高。同样地,相反地,如果复制的站点是非常未知的,它就不能带来站点名称/稳定性/速度的增益。更重要的是,转载后,大量广告被添加到页面中阻碍阅读,或者只是转载了不完整的部分内容。这样的重印,或收藏,纯粹是重复。与集合源相比,它没有检索值。综上所述,我们应该评估具有重复主要内容的页面是否存在站点增益和内容增益。只有对大量重复的页面没有收益,我们才应该认为它们的稀缺性很低。

这里的要点是:页面值、增益

因此,只要能给用户带来网站收益、内容收益和附加值,就说明这个页面有其独到的价值,不会受到飓风算法的冲击。后百度的朋友透露,飓风算法主要是针对没有价值的收藏,一旦没有解决方案。高质量的误伤原件可通过反馈中心进行申诉。如何避免被飓风算法击中。我将在下一篇文章中讨论这个问题

百度近期的战略调整,将内容生态作为重中之重。必须攻击错误的集合内容。

我预测百度搜索内容的主旋律将是对收藏的攻击和对原创的支持,而飓风算法将继续更新。

本文标签:百度飓风算法