【发布时间】:2014-01-25 19:35:06
【问题描述】:
我需要以每分钟 8 页的速度抓取一个网站。现在我希望我向远程服务器发出的请求在一分钟内均匀分布,这样就不会损害服务器它正在请求。
如何在两个连续请求之间保持以秒为单位的统一时间差?最好的方法是什么?
【问题讨论】:
-
难道没有办法在 PHP 中设置某种延迟?
-
@Oleg 是的,它就在那里。但我猜,使用延迟并不好。不必要地消耗资源。我猜这不是一个可扩展的东西。
-
您提到您有上限约束(每分钟 8 次),但您是否也有下限约束(例如每分钟最少次数)?如果不是,您可以每 60/8 秒使用您的编程语言版本的 sleep() ..?
-
@MeganSquire 没有其他解决方案?
标签: php web-crawler