【发布时间】:2014-01-26 19:05:18
【问题描述】:
假设我们正在使用带有mod_rewrite 或类似内容的漂亮 URL,并且具有以下两条路由:
/page/page-two
现在我们只想禁止机器人抓取第一条路线 (/page)。
# robots.txt
User-agent: *
Disallow: /page
禁止 (http://www.robotstxt.org/orig.html):
... 例如,Disallow: /help 禁止 /help.html 和 /help/index.html,而 Disallow: /help/ 将禁止 /help/index.html 但允许 /help.html。
所以上面的robots.txt 示例也不允许/page-two,对吗?
完成这项工作的正确方法是什么?
可能是下面的代码?
# robots.txt
User-agent: *
Disallow: /page/
【问题讨论】:
-
Disallow: /pagenot 不允许/page-two。 -
你确定那个(考虑到我的问题中robotstxt.org的引用)? :-O
-
@JosephSilber:你错了,确实如此。 URL 没有文件/目录的概念。
标签: php mod-rewrite laravel robots.txt pretty-urls