【问题标题】:Apache: Blocking bad bots and site rippersApache:阻止恶意机器人和网站撕裂者
【发布时间】:2010-12-29 11:01:22
【问题描述】:

今天,我读到了这篇文章: http://www.javascriptkit.com/howto/htaccess13.shtml

. 是否很好并建议添加 htaccess 文件?我想知道每个人的想法。我对此没有经验。

【问题讨论】:

    标签: apache .htaccess


    【解决方案1】:

    我的服务器上至少有 6 年了。不仅如此,还有防止其他站点上的图像热链接的东西。我认为你没有什么可失去的。

    【讨论】:

    • 你有什么更新这篇文章的吗(列出并...或删除任何一行)?
    • 不可能有一个完整的列表,列出所有糟糕的开膛手,因为一旦你完成一个“最终”列表,就会出现更多。我在这个名单上认识了几个著名的开膛手,但你能做的最好的事情就是每个月查看你的日志,并用你可能会发现的新竞争者更新名单。有些人像中国和其他人一样完全屏蔽整个国家,但这可能过于激进,因为您可以屏蔽合法用户。您可以做的一件事是建造陷阱来捕捉裂土器。可以使用 robots.txt 文件构建一个经典示例。
    • 这个陷阱的工作原理是这样的:您在 Web 服务器的根目录上创建一个名为“important”的目录。在您的 robots.txt 中,您输入“Disallow: /important”行。这一行指示搜索引擎不要关注该目录中的内容,所有严肃的搜索引擎都会尊重这一点。开膛手不会。因此,您在 /important 中放置了一个脚本,将访问者 IP 添加到黑名单中,一英里秒后服务器开始阻止该 IP 读取任何页面。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2012-04-14
    • 1970-01-01
    • 1970-01-01
    • 2012-12-24
    • 2018-07-29
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多