被百度降权的经历:没有百度的日子,是百度给的无期徒刑

· 浏览次数 : 106

小编点评

总结: 这篇文章讲述了作者所在的博客园在2022年前后的经历,特别是与百度搜索引擎的关系变化。文章通过回顾过去的事情,分析了博客园在没有进行SEO优化的前提下,如何意外地获得了百度的友好对待,并在2022年春天因忽视合规风险而遭受搜索引擎的惩罚。随后,文章描述了博客园在面对搜索引擎的惩罚和流量下降的困境时,如何采取了限流措施,并最终意识到与百度的合作已经无法挽回。文章以作者的视角,表达了对过去十多年与百度合作的怀念和对未来的无奈。 1. **2022年之前的情况**:文章开头提到,在2022年之前,博客园并未进行SEO优化,但百度对其表现出了友好,排名上升快,吸引了大量想要推广的人。 2. **2022年春天的困境**:随着2022年春天的到来,博客园开始面临合规风险,担心审核工作不到位,搜索排名和收录受到影响。 3. **搜索引擎的惩罚**:2022年4月,百度蜘蛛的疯狂访问导致了博客园的宕机,随后博客园被百度降权,收录和流量都受到了影响。 4. **限流措施**:为了应对搜索引擎的惩罚,博客园采取了限流措施,限制了同一个IP的请求数量,以避免再次出现宕机。 5. **解除屏蔽的尝试**:在意识到问题后,博客园尝试解除对百度蜘蛛的屏蔽,希望能够恢复搜索流量。 6. **搜索流量的下降与恢复**:尽管解除了屏蔽,但百度搜索流量并没有明显回升,收录问题依然存在。 7. **重新审视合作关系**:文章最后指出,博客园意识到与百度的合作已经无法挽回,决定放弃幻想,接受现实,并以纪念的心态写下这篇博文。 总的来说,文章通过博客园与百度搜索引擎的关系变迁,反映了搜索引擎优化的重要性以及与搜索引擎合作时的风险和挑战。

正文

2022年之前的十多年,我们没有做任何SEO,但百度一直对园子很友好,好到成为一种烦恼。因为排名前,收录快,很多想推广的人想尽办法骗过审核开通博客发推广内容,以求快速被百度收录,甚至有人在淘宝开店专门卖已经开通博客的博客园账号,后来我们多次向淘宝投诉这个商品才被下架。

由于身在福中不知福,我们没有花心思去研究SEO,也懒得关注搜索排名与收录情况,而不少人误以为我们擅长SEO。

2022年春天,我们刚刚从2021年大半年的整改中恢复过来,百废待兴,那时最大的担心是怕审核工作做不到位带来合规风险,那时甚至希望百度搜索排名低一些,收录慢一些,因为越容易被搜索到,合规风险越大。再加上随着广告单子的突然减少,流量变现成烦恼,搜索流量反而成为成本负担。

当我们在被百度青睐所带来的幸福中不思进取时,追求持续创新的百度默默无闻地升级了蜘蛛系统。

2022年4月,当创新的大脚步遇上不思进取的原地踏步,悲剧就发生了,整个园子被百度新型蜘蛛爬宕机了。

2022年4月3日,它(百度蜘蛛)的首次来访在园子里掀起狂风暴浪,数据库连接数过万,负载均衡带宽跑满,带宽扩容50%依然跑满,当时我们通过限制同一个IP每天的请求数侥幸躲过。

在侥幸躲过后,我们没有认真复盘仔细分析,依然是不思进取地选择放过。

2022年5月,当创新的更大脚步遇上惊慌失措的鲁莽,悲剧就播种了。

2022年5月4日,它(百度蜘蛛)如同吃了兴奋剂般变得格外疯狂,由于触发IP请求数限制被重定向到登录站点,但它那龙卷风般的天量请求直接冲垮登录站点,无奈之下,我们屏蔽了这个IP网段。

后来,由于忙于其他事情忙昏了头,我们竟然把屏蔽的百度蜘蛛的事情给忘了。

由于我们对百度蜘蛛的鲁莽屏蔽,来自百度的搜索流量逐步降低,但由于当时我们头顶上始终悬挂着一把剑——「审核审核再审核,合规合规再合规」,已经不怎么关注流量的升降,不再为流量增长而兴奋,不再为流量的下降而担心,再加上那段特殊的日子,流量下降被误以为是正常现象。

当过了一段时间,当流量下降到一定幅度的时候,我们才猛然发现闯下了大祸——我们一直屏蔽着那个百度蜘蛛网段,造成百度搜索流量持续下降。

赶紧解除屏蔽,带着亡羊补牢的侥幸心理期待着百度搜索的流量能逐步恢复,而我们蒙在鼓里的是,针对我们的过错,百度当时已经铁面无私默默无闻地宣判了,判了一个无期徒刑——从今往后,百度搜索引擎与博客园恩断义绝,搜索权重能降则降,收录能不收则不收。

解除屏蔽后等了2个月左右,我们发现百度流量并没有恢复的趋势。在这段时间我们将百度蜘蛛的请求解析到一台专门的负载均衡,限制了最高带宽以免再次出现百度蜘蛛过高的并发请求造成宕机。这样独立出来也带来一个额外的好处,我们可以清楚地知道百度蜘蛛产生的带宽费用,而结果却让我们惊呆了,仅仅百度蜘蛛的爬网竟然消耗了40%左右的带宽费用。当时已经进入2022年下半年,园子一年多几乎没有收入的日子已经开始了。一边百度蜘蛛肆无忌惮地消耗着带宽费用,一边百度搜索流量恢复无望,我们不敢再拿越来越紧张的现金赌百度认同“浪子回头金不换“(幸亏没赌,不然会输的很惨),对百度蜘蛛进行了限流。

都没顾得上和百度说声分手快乐,带着现实所逼产生的勇气,默默地对百度说了句——没有百度的日子,园子依然可以。

但残酷的现实是,没有百度的日子里,园子过得惨兮兮,从求捐助,到求会员救园,差点没熬过去。

在这段离开百度的悲惨日子里,还发生了一个小插曲。2023年3月,未知原因造成百度蜘蛛躲过限流,又把园子爬宕机,我们借此时机发了篇博文吐怨气,没想到后来带来一次戏剧性的回心转意。

2023年9月20日与9月21日,由于百度搜索部门的人看到我们3月发布的博文,联系我们商量解决百度蜘蛛爬网并发请求过高的问题,最终百度设置了我们建议的QPS上限,我们取消了对百度蜘蛛的限流,消除了友好相处的所有障碍。

当我们满怀希望地期待着幸福来敲门时,一个月过去了,百度搜索流量没有明显回升,收录问题依然没有解决。又一月过去了,问题依然没有解决。半年过去了,期间百度搜索流量有小幅回升,那只是百度安慰似地给定小惊喜。现在大半年过去,所期待的幸福遥遥无期。联系到园子的博问刚上线没多久就被百度判了无期徒刑——搜索排名低、收录很少,然后十多年一直这样,现在博客主站遇到的问题与博问类似。于是,我们放弃了幻想,有了迟到的领悟,原来2023年双方商量解除限流的努力都是徒劳无益,百度的字典里根本没有回心转意,一旦得罪就判无期徒刑,结局早已注定。

园子与百度十八年友好相处的日子再也回不去了,今天一鼓作气写下这篇博文留下纪念。

相关链接:

与被百度降权的经历:没有百度的日子,是百度给的无期徒刑相似的内容:

被百度降权的经历:没有百度的日子,是百度给的无期徒刑

2022年之前的十多年,我们没有做任何SEO,但百度一直对园子很友好,好到成为一种烦恼。因为排名前,收录快,很多想推广的人想尽办法骗过审核开通博客发推广内容,以求快速被百度收录,甚至有人在淘宝开店专门卖已经开通博客的博客园账号,后来我们多次向淘宝投诉这个商品才被下架。 由于身在福中不知福,我们没有花

面对百度的无期徒刑,幸好还有微软的必应

昨天我们通过【i博客园】公众号发布文章 被百度降权的经历:没有百度的日子,是百度给的无期徒刑 时发现,百度不但没有回心转意,反而对园子的处罚更加严厉了,博客主站(www域名)的新发内容一天内0收录。 而在去年9月21日我们完全解除对百度蜘蛛的屏蔽后(详见博文),9月25日那天一天内的百度收录有20页

「指间灵动,快码加编」:阿里云通义灵码,再次降临博客园

目前园子的主要收入来源是会员、周边、广告,在当前会员与周边收入很少的情况下,随着今年广告业务的回暖,广告收入成为维持生存的新希望。 虽然因为被百度降权失去了巨大的搜索流量,但如果找到长期合作的广告单子,基于园子高质量的用户群,依靠现有的流量,努力做好推广,通过广告收入维持基本生存是可行的。 但残酷的

蜘蛛的依旧疯狂与园子的新畅想:尝试放出被屏蔽的百度蜘蛛网段

因为看到博文,百度搜索部门的人昨天对园子进行了线上回访,让我们看到了一丝希望。今天早上,带着这丝希望,我们试着放出今年3月因为过于疯狂、喜欢在别人地盘上飙车而被我们屏蔽的百度蜘蛛网段,看看半年之后它是否“疯”子回头,结果依旧是意料之中的疯狂依旧,“疯”性难移

上周热点回顾(9.18-9.24)

热点随笔: · 蜘蛛的依旧疯狂与园子的新畅想:尝试放出被屏蔽的百度蜘蛛网段 (博客园团队)· 逃不过转行的命运,与互联网无缘了 (哈er)· JDK21来了!附重要更新说明 (DaFanJoy)· 【逆向专题】【危!!!刑】(一)使用c#+Win32Api实现进程注入到wechat (四处观察)· 

[转帖]x86服务器中网络性能分析与调优(高并发、大流量网卡调优)

最近在百度云做一些RTC大客户的项目,晚上边缘计算的一台宿主机由于CPU单核耗被打满,最后查到原因是网卡调优没有生效,今天查了一下网卡调优的资料,欢迎大家共同探讨。 一.网卡调优方法 1、Broadcom的网卡建议关闭GRO功能 ethtool -K eth0 gro off ethtool -K

【转帖】x86服务器中网络性能分析与调优(高并发、大流量网卡调优)

最近在百度云做一些RTC大客户的项目,晚上边缘计算的一台宿主机由于CPU单核耗被打满,最后查到原因是网卡调优没有生效,今天查了一下网卡调优的资料,欢迎大家共同探讨。 一.网卡调优方法 1、Broadcom的网卡建议关闭GRO功能 ethtool -K eth0 gro off ethtool -K

【转帖】x86服务器中网络性能分析与调优(高并发、大流量网卡调优)

最近在百度云做一些RTC大客户的项目,晚上边缘计算的一台宿主机由于CPU单核耗被打满,最后查到原因是网卡调优没有生效,今天查了一下网卡调优的资料,欢迎大家共同探讨。 一.网卡调优方法 1、Broadcom的网卡建议关闭GRO功能 ethtool -K eth0 gro off ethtool -K

【转帖】x86服务器中网络性能分析与调优(高并发、大流量网卡调优)

最近在百度云做一些RTC大客户的项目,晚上边缘计算的一台宿主机由于CPU单核耗被打满,最后查到原因是网卡调优没有生效,今天查了一下网卡调优的资料,欢迎大家共同探讨。 一.网卡调优方法 1、Broadcom的网卡建议关闭GRO功能 ethtool -K eth0 gro off ethtool -K

关系型数据库设计三大范式

作者:郑龙飞 范式定义 百度百科:设计关系数据库时,遵从不同的规范要求,设计出合理的关系型数据库,这些不同的规范要求被称为不同的范式,各种范式呈递次规范,越高的范式数据库冗余越小。 人类语言: 范式可以理解为设计一张数据表的表结构,符合的标准级别、规范和要求。 而通常我们用的最多的就是第一范式(1N