【发布时间】:2023-12-27 23:22:02
【问题描述】:
假设所有机器人的用户代理在用户代理字符串中总是有 URL 是否安全? 当然,我会将用户代理与机器人列表进行比较,但这里的想法是先进行初步检查,然后再将其与长列表进行检查。
如果我可以更好地改写我的问题,是否有任何有效的非机器人、非爬虫、非蜘蛛或任何非肮脏的生物在用户代理中有 URL?
【问题讨论】:
-
你真的想按照这个假设工作吗?
-
@Pekka:我想过滤掉机器人/蜘蛛的访问。
-
@user 看到我不久前的相关问题*.com/questions/1717049/…
-
感谢 Pekka 的回答和链接 :)
-
@user173457 互联网不是这样工作的。你把内容放上去,人们有权按他们的意愿访问它。你能做的最好的就是保留一个有效的robots.txt。
标签: browser web-crawler user-agent bots