【发布时间】:2011-04-10 14:41:19
【问题描述】:
目前我正在使用 Mechanize 和 get() 方法来获取每个站点,并使用 content() 方法检查每个主页的某些内容。 我有一台非常快的计算机 + 10Mbit 连接,但仍然花了 9 个小时检查 11K 个站点,这是不可接受的,问题是 get() 函数的速度,显然需要获取页面,有什么方法可以让它更快,也许禁用某些东西,因为我只需要检查主页 html。
谢谢,
【问题讨论】:
标签: perl web-crawler www-mechanize