【发布时间】:2012-05-07 14:26:40
【问题描述】:
这是我的robots.txt。我只想允许基本 url domain.com 用于索引并禁止所有子 url,如 domain.com/foo 和 domain.com/bar.html。
User-agent: *
Disallow: /*/
因为我不确定这是否是有效的语法,所以我使用 Google 网站管理员工具对其进行了测试。它向我显示了这条消息。
robots.txt file is probably invalid.
我的文件有效吗?有没有更好的方法只允许基本 url 进行索引?
更新:Google 在 4 小时前下载了我的 robots.txt。我认为这就是为什么它不起作用。我会等待一段时间,如果问题仍然存在,我会再次更新我的问题。
【问题讨论】:
-
我读到了这个:stackoverflow.com/questions/5206602/… 但不明白答案。
-
这是另一个可能有帮助的类似问题:stackoverflow.com/q/43427/669611
标签: indexing web-crawler robots.txt