【发布时间】:2009-02-25 12:52:39
【问题描述】:
基本上我需要绕过最大执行时间。
我需要以不同的时间间隔抓取页面以获取信息,这意味着在这些时间间隔调用机器人,以从数据库加载链接并抓取链接指向的页面。
问题是,加载机器人。如果我用 javascript 加载它(比如 Ajax 调用),浏览器会抛出一个错误,指出页面响应时间太长 yadda yadda yadda,另外我必须保持页面打开。
如果我从 PHP 中执行此操作,我可能会将执行时间延长到所需的时间,但如果它确实引发错误,我无权终止进程,并且浏览器中不会显示任何内容,直到PHP 执行完成了吧?
我想知道是否有人有任何技巧来解决这个问题?刮板会在不同的时间间隔自行执行,我不需要一直看它。
干杯:)
【问题讨论】:
标签: php web-crawler