【发布时间】:2014-10-06 11:13:53
【问题描述】:
我有一个网站,网络爬虫机器人多次访问该网站。我想摆脱它。请建议我可能的解决方案,以避免我的网站被机器人访问。
提前致谢!
【问题讨论】:
标签: web-crawler user-agent robots.txt
我有一个网站,网络爬虫机器人多次访问该网站。我想摆脱它。请建议我可能的解决方案,以避免我的网站被机器人访问。
提前致谢!
【问题讨论】:
标签: web-crawler user-agent robots.txt
如果您的网站是公开的,那么您的选择是有限的。以下是一些建议:
您没有说明为什么要阻止他们。这个问题的答案可能会影响你采取的方法。例如,如果您想将敏感数据保留给选定的一组人,那么密码保护可能是最好的方法,而不是试图永远追捕机器人。如果这是一个站点性能问题,请为您的站点考虑一个更强大的主机。希望以上建议中的一项或多项可以为您完成这项工作。
【讨论】: