我找到了一份工作在一个网站在5月初。我已经忙了一个月。我第一次看了看效果图的提升坏街我终于松了一口气。
 
 
 
 
 
 
 3吗?我在哪儿?我是谁?我应该做什么?我现在正在做的事是如何防止百度不断访问旧的页面。因为一个网站爬虫是一种宝贵的资源它是一种有限的资源。与一个固定数量的爬虫我们必须引导爬虫访问尽可能多的高质量的页面。现在的问题是因为有太多的爬虫程序分配给旧的链接没有许多爬虫访问新内容。要做什么!吗?!4. 破碎的链接建设的秘密书与一个大光头让我想起了破碎的链接建设指导国外大光头(404年死链接外部链接建设指南)我以前读过。有一章重构无效的内容。
大光头显然是过于昂贵取代死链接的内容。我有一个大胆的想法。我可以随机301旧内容的新内容?它将是有效的。然后做一个小规模的实验。我把一个小网站做了一个总体301测试在以下目录中。你可以找到百度爬虫处理301:301年履带遇到之后它将移交给另一个IP爬虫爬
然后百度的后续处理效果如何我我用这个问题/ 51 k109页面做一个简单的跟踪:老页面:
 :
我看到301年后将会有两个快照百度过程百度快速排名丿首选金手指10将会有两个快照百度过程但新页面显示一张图片显示重量在301年之后已经成功转移了。让?年代做5。如果代码访问旧的页面(旧的扩展页面xhtml或asp特定的问题详细分析了)它将随机跳转到文章页面或学校(学校文章页面页面转换和内容质量好具体问题具体分析)
 301的效果是非常快通常最多两个星期你可以看到6月20日的曲线是在互联网上。