6年百度搜索算法,盘点与解读

1 评论 6327 浏览 60 收藏 20 分钟

本文笔者将带领大家对6年来百度在搜索算法上所做的事情做一个盘点,并对其进行解读分析,提出规范搜索生态的一些建议。

自2013年开始,百度陆陆续续的公布了13个算法,48篇公告及算法解读的文章。这也是百度有史以来最为活跃的阶段,同时也看出了百度对于互联网生态作出的巨大努力!

在这整整的6年时间里,通过百度的不懈努力,我作为一个行业老兵,所看到的是关键词堆砌、买卖链接以及各种欺骗用户、网站内广告横飞、采集无死角般存在的种种现象得到了很大幅度的改善。而这本身帮助所有用户净化了互联网下的搜索生态,也指导并规范了站长或者是SEO从业者们更多的工作内容、网站建议等。

那下面我们来看看这6年百度都做了哪些事情,来规范搜索生态的同时指导我们的工作。

网页内容质量:内容是搜索需求最核心的本质

在这个主题下,百度发布了3个算法,他们分别是:

1. 飓风算法,严厉打击恶劣采集行为的网站

飓风算法开始生效的时候,影响了很多依托于恶劣采集行为的网站,形成了行业内的轰动,也大大改变了站长做内容主要以采集为主的行为。使得当下更多站长专心做优质内容而非投机取巧、盗用他人成果的行为。

2. 细雨算法,针对B2B领域的受益行为

针对于B2B的网站而言,对其虚假官网、标题堆砌关键词、标题和内容穿插受益方式(如联系电话)以及内容采集、语句不通顺等行为进行了规范,同样会针对不符合标准的站点进行打击。

3.  蓝天算法1.0,严厉打击售卖软文、目录的行为

在一些优质的网站进行软文的发布,而所谓的优质站点从中获取收益,以及这些站点通过售卖目录的形式从中牟利。通过百度对这些站点的历史信任,不正当的帮助他人破坏搜索生态,影响用户体验,同时也损害了自身网站的行为给与严厉的打击。

这三个算法分别从内容采集、行业规范以及内容交易三个方面对内容本身进行规范,其效果显著、成果颇丰。

用户需求满足:没有什么比满足搜索用户需求更重要的了!

作为全球最大的中文搜索引擎,百度肩负着一定的责任。对于绝对多数用户而言,他们不关注搜索结果是广告、还是自然结果。他们需要的就是解决自己搜索的那个需求。而致力于这一点百度也希望用户能够在使用百度搜索产品时,能够花最短的时间、最少的点击次数解决自己的需求。

这中间百度公布了如下几个算法:

清风算法1.0,严惩网页标题作弊

网页的标题(Title)对于参与搜索排名而言是十分重要的,如果文不对题、内容虚假、关键词重复,势必会误导用户点击,但并不能解决用户的真实需求。

那网页标题作弊的行为,就是严重的影响了用户搜索体验,严惩不贷、绝不姑息!同时,百度也考虑到很多站长和SEO从业者不明确如何写网页标题才是正确的,也人性化的给出了《网页标题规范建议》的相关指导文件,希望站长能够按照一定的规范对标题进行合理的书写。

清风算法3.0,规范下载行业欺骗下载、捆绑下载等行为

不知从什么时候开始我们在百度搜索一些软件下载时,那些软件下载的站点提供的下载按钮,要么就下载软件不对,要么就捆绑一大堆其他垃圾软件。他虽然要谋利,但对我来说形成了困扰,而百度再次针对下载行业进行了规范。

打击虚假诈骗、违法违规行为

针对一些搜索词本身进行的打击行为、例如你搜索的需求涉及黄赌毒、诈骗、证件伪造等,对不起百度不想满足你的这类需求。因为这类需求本身目的是不纯的,虽然对大多数站长没什么影响,但这点要给百度点赞,真的很“正”!

信风算法,控制翻页诱导行为

一篇文章有三页,点击第三页的时候突然到了列表页或是注册页。难道不应该是这篇文章的第三页吗?又被骗了!难道这种行为不要打击吗?至少百度不希望搜索结果中有这么恶心人的网站存在,你觉得百度管的有点多,没关系!你可以不通过百度获取流量,这没人拦着你!

搜索恶意竞争:打造公平的搜索排序竞争平台

在这个主题下,百度最为大快人心的就是推出了“惊雷算法”,针对流量作弊、超链接作弊的行为进行严厉的打击!

例如:通过我们行业老话所说的“链接传递权重”的定义,某站点通过购买、恶意制造大量的外部链接来指向目标网站对应关键词,从而提升网站排名。

其次,就是通过刷点击的行为,让那些投机取巧的站长,自认为刷一刷点击排名就能上去的人,尝到一定的恶果。

当然,这一点从目前来看还是有待提升,不过我相信通过百度的一定努力,大大改善这个现状也只是时间问题!

网站安全问题:影响用户、影响搜索引擎、更影响你的网站

网站的安全问题同样是百度十分关注的问题,现如今多数网站的防范意识有待提高,站长应对安全问题的经验也是略有欠佳。因此,百度更加希望各站长看中安全问题、防患于未然,发现即处理。

在这个主题下,百度发布了:

烽火算法2.0:打击遭受网站劫持的站点

烽火算法打击的网站劫持有两种表现形式,第一种是跳转劫持,当用户点击目标网页后,页面直接跳转至另一页面的劫持行为。

而另一种是后退劫持,用户完成对某网页的浏览,点击“后退”按钮时出现以下几种情况 :

  1. 无法后退,点击后退时页面无反应,内容无变化 ;
  2. 后退到“假百度页面”,搜索结果出现霸屏现象;
  3. 后退到用户之前没有访问过的垃圾、作弊等低质网页。

网站被黑情况:几种不同的网站被黑情况

网站被黑,通常表现为网站中出现大量非本网站发布的类似博彩内容,或网站页面直接跳转到博彩页面。

以下是几种网站被黑后可能出现的页面:

1)内容非网站发布,内容中含大量博彩网站指向:

6年时间,百度搜索算法的盘点与解读

2)网站页面直接跳转到博彩网站:

6年时间,百度搜索算法的盘点与解读

网站被黑表明网站安全存在严重问题或漏洞,而搜索引擎更加不希望收录甚至展现这样的内容给搜索用户,所以当网站出现这类情况时,必须及时发现、彻底解决。

落地页体验问题:不是内容好,是网页综合都要好!

可以说现在还会有一部分人,只是简单的关注到网页本身的内容好坏,例如:是不是原创、采集等。

但对于搜索引擎而言,从用户搜索完,点击没一个网页时,用户所接触的是你这样网页,而并不非单单是里面的内容。假设你的网页打开花了5秒,而排名在第一位,用户会说你的网站不好呢?还是谁说搜索引擎的体验不好呢?

针对这个主题,相关的算法如下:

冰桶算法5.0: 规范落地页,提升搜索用户体验

冰桶算法在网页质量的多个维度上提出一个规范,如:

  1. 资源流畅性:网页整体的访问速度,如上面提到的,网页打开的速度快与慢直接影响了搜索用户的浏览体验。百度对用户行为的研究表明:页面首屏的加载时长在1.5秒以内的网站,会带给用户流畅快捷的极速体验。我建议的是网页首屏的加载最多不要超过2秒,最好是能在1.5秒以内。
  2. 页面浏览体验:从网页的排版布局、首屏出现主体内容的50%或以上、结构清晰、导航功能明确等,总之从用户看到网页那一刻网站的排版布局应该是整洁的、有序的,主体内容阅读也是轻松的。
  3. 移动端适配:这里主要强调的是参与移动端排名的网页应该是移动端网页,而不能是PC的,这个很多人要注意一下。
  4. 落地页的广告规范:在移动端针对广告进行限制,说明了应该使用什么广告,而又不能使用什么广告。例如:悬浮广告、弹窗广告、遮屏广告等影响用户正常浏览,或是对用户浏览造成障碍、误导、欺骗以及涉嫌违法行为的广告都是不可取的。

权限问题:减少用户获取信息的成本

用户在浏览一些网站时,遇到像阅读全文、查看图片、观看视频内容等情况时,这些网站会提示用户完成某些动作。

例如:注册后方可查阅等行为的。是在增加用户获取信息的一些成本,针对这种行为,百度也是压力打击的。下面列举两个百度提供的小示例。

1)用户需要登录才可以查看大图:

6年时间,百度搜索算法的盘点与解读

2)用户需要登录才可以查看论坛帖子的全部内容:

6年时间,百度搜索算法的盘点与解读

3)用户需要下载或打开APP才可以查看全文:

6年时间,百度搜索算法的盘点与解读

我是如何看待百度这6年的动作的?

其实,在百度这6年的时间里,围绕着五大主题来规范互联网生态、规范很多、也约束很多,更加的收获很多。这中间必定会有一些自己的想法出来,想与你分享一下。

这次算法的大盘点主要针对的是五个主题:网站内容质量、用户需求满足、搜索恶意竞争、网站安全问题以及落地页的体验问题。

我按照这五个主题依次来说说我的看法。

1. 网站内容质量

内容本身是最重要的,这不言而喻。但如今的一些站长更多维度上是关注流量,是想着投机取巧的,轻松搞定内容本身,从而通过搜索引擎获得更多的流量。但实际证明,太多具有这样想法的网站并没有获得很好的流量。

我们想一下,既然百度这么重视内容,以百度的技术实力,识别哪些内容是原创的、能够解决用户需求的、语句是不是通顺。对比而言,这个可能性还是很大的。那你不用心好好做内容,一定要伪原创、窃取别人的劳动成果。结果多数是徒劳的呀!

我的博客从今年的年初开始拾起来,继续更新博文。到目前更新也就90篇文章,流量增长、参与关键词排名的词数都是一度增长的。你可以通过lishi.aizhan.com查询我网站的关键词增长情况。如果你懒得查,下面这两张图是我为你备好的。

6年时间,百度搜索算法的盘点与解读

6年时间,百度搜索算法的盘点与解读

我一直在专心做内容,每天发布的文章也就1~3篇的样子,耗时也只有3个小时以内。成果足以说明内容的重要性,以及百度对内容识别的技术能力。

2. 用户需求满足

我之前有写一篇文章,提到了搜索引擎是怎么识别你的网页能否满足用户的需求,不了解的可以看下:搜索点击日志与排序反映的问题,当然想必实际的识别算法并不仅仅这一个。

那我们是不是更应该以内容为主,想着标题说的是张三,内容里介绍的也是张三。等用户看完了文章,要么在我们的网站上留言更多与张三相关的内容,要么回到搜索引擎展开对张三更加细致的详细搜索呢?

而一定不是,又回到刚才的搜索结果页,点击别人的排名结果。所以做内容至少要本着满足用户的需求,然后网页本身提供更多有价值的、与当前主题相关的延展阅读内容。

切勿为了创造内容,而创造内容!

3. 搜索恶意点击

利用搜索引擎的一些算法,针对性的去进行作弊。这里提到了一种是基于链接的、一种是基于刷点击的两种行为。

针对链接而言:你能够制造的高质量链接是有限的,你获取每天都在建设外链,但结果却没任何变化。

如果真的要做外链,那么也请先考虑一下:你的外链是不是被收录了,参与了排名了?如果外链本身没质量,又怎么会给你带来更大的效果呢?

其次,就是找一些专门的公司,他们具有大量的网站,然后你通过付费与他们合作,从而给你的网站一定的链接数量,从而提升排名。但这样做的价格是不低的。

不知道你有没有计算过与他合作的费用,然后到你网站内实际的转化。这中间的成本是多少?我觉得不比直接做SEM的成本低!

因为SEM是搜索广告,其落地页是可以制定的。而SEO的落地页是没办法指定的额,都是自然搜索结果的落地页。对比而言,SEM落地页的流量转化率对比你SEO页面的流量转化率一般都高出10倍!

但你做找这个乙方通过连接做排名的价格是不是低于SEM的10倍呢?

刷点击,现在市面的工具、服务公司都不少。但实话讲,大概率都会被百度识别出来,然后遭受惩罚。

如果被惩罚了,你该怎么办?这些工具提供商、服务公司能帮助第二天再刷上去吗?

如果不能的话,你的损失对比短期的收益而言,孰轻孰重?还请你自行判断!

4. 网站安全问题

针对于安全,不用百度来约束,每个网站都应该预防好,发现时更应该及时的处理。没什么需要多说的!

5. 落地页体验问题

请你端正自己的意识,参与搜索排序的并不是你的内容,而是你的网页。如果网页排版布局混乱、广告横飞、内容主体字体过小、段落又不清晰。那你愿意再这样的网站上读完内容的概率有多大?

你又会认为这样的网站,或是你看到的这个网页是好的还是不好的呢?

如果你都认为不好,那么为什么自己的网站、网页会是这个样子呢?

百度提出的一些规范、要求,我觉得本应就是站长人员应该基于用户本身去做的事情,而并非是基于搜索引擎要做的事情。

最后,我想同步给大家一个观点。对搜索引擎而言,不要仅仅认为要重点搞定收录索引、排名展现,而应该从用户需求出发创造属于自己独有的稀缺内容,且坚持更新积累、搜索流量必然带来会稳健的增长起来。

只有这样,你的网站才不怕搜索引擎哪天又出了一个算法影响了你,围绕用户展开的网站建设、内容建设这样的目标,是与搜索引擎的目标一致的。

那你网站和搜索引擎的目标都一致了,还怕什么算法会影响你吗?

 

本文由@赵彦刚 原创发布于人人都是产品经理,未经许可,禁止转载

题图来自Unspalsh, 基于CC0协议

更多精彩内容,请关注人人都是产品经理微信公众号或下载App
海报
评论
评论请登录
  1. 写的不错

    来自重庆 回复