【发布时间】:2009-08-20 21:22:05
【问题描述】:
Googlebot 偶尔会使用错误的查询字符串参数为我们的某个网站编制索引。我不确定它是如何获取此查询字符串参数的(似乎没有任何网站使用错误链接链接到我们,并且我们网站中的任何内容都没有插入错误值)。如我们所料,bad 参数会导致网站抛出 500 错误。
我的印象是 Google 不会索引返回 500 错误的页面,但事实证明确实如此。所以现在我有两个问题:
1) 为什么 Googlebot 会随机插入错误的查询字符串值? (我并不真正关心这个问题的答案,但如果我们能做点什么来避免这种情况,它就会解决我们的问题。)
2) 为什么 Google 要将返回 500 错误的页面编入索引?
以下是 Googlebot 创建并已被 Google 编入索引的错误链接之一:
http://www.pbs.org/teacherline/catalog/browse/?sa=4&gb=baqhuxts&gb=20&gb=21&num=20&page=2&js=0&sa=1
错误的参数是 gb=baqhuxts。参数“gb”应为整数。如果您从查询字符串中删除该参数,您应该会看到一个漂亮的目录页面。
关于 nofollow 和 robots.txt 解决方案:[已编辑]
我现在意识到我是个白痴,并放置了一个元标记告诉搜索机器人索引页面。那是一件愚蠢的事情。我正在删除那些。 W-(
如果你search on Google for 'baqhuxts' 你会发现它已经用这个错误的参数索引了 10 个页面。但是这些页面中的每一个都返回 500 错误。有没有人知道为什么 Google 认为这些是有效的索引页面?
【问题讨论】:
-
查询字符串中具体有什么错误?也就是说,要获得有效的结果,必须在该 URI 中进行哪些更改?这可能有助于解释发生了什么。
-
好消息@voteydisciple。我添加了对查询字符串中的错误的解释。 'gb' 参数应为整数。
-
网站底部版权回归一年。
-
既然你已经把这个网址放到了这个页面上,谷歌就会爬遍它!
标签: indexing seo search-engine googlebot