【问题标题】:PHP crawler in redirected URL重定向 URL 中的 PHP 爬虫
【发布时间】:2021-04-15 14:27:09
【问题描述】:

我调用一个 URL,两秒钟后它打开一个随机 URL。 我想要第二个 URL 的内容。 我尝试了 Goutte 和 CURL,但它不能正常工作,可能是因为重定向延迟。 有人有解决办法吗?

【问题讨论】:

  • 你能把目前尝试过的代码dd吗。

标签: php redirect web-crawler goutte


【解决方案1】:

要使用 cURL 遵循标准 HTTP 重定向,请设置 CURLOPT_FOLLOWLOCATION 选项:

curl_setopt($handle, CURLOPT_FOLLOWLOCATION, true);

See docs

如果重定向是通过非标准方式完成的,即 JavaScript,这将不起作用。

【讨论】:

  • 请提供有关页面如何重定向的更多详细信息,即第一个 URL
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 2011-08-03
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2015-07-28
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多