【发布时间】:2008-08-28 14:17:35
【问题描述】:
我今天才开始考虑创建/自定义网络爬虫,对网络爬虫/机器人礼仪知之甚少。我发现的大部分关于礼仪的著作都显得陈旧而笨拙,所以我想从网络开发者社区获得一些当前(和实用)的见解。
为了一个超级简单的目的,我想使用爬虫在“网络”上行走 - “网站 XYZ 的标记是否满足条件 ABC?”。
这对我提出了很多问题,但我认为我首先需要解决的两个主要问题是:
- 从一开始就感觉有点“不确定”——这种事情可以接受吗?
- 爬虫应采取哪些具体考虑因素才能不让人们感到不安?
【问题讨论】:
标签: web-crawler