【发布时间】:2018-09-10 04:39:40
【问题描述】:
在尝试打印 simplehtmldom 的输出时,它给了我 500 错误。我尝试了以下方法,但错误相同。
-
方法一
$html = file_get_html("http://www.google.com");
print_r($html);
在阅读了对其他问题的回复后,我检查了 allow_url_fopen 是否工作正常。
-
方法二
$html = file_get_contents("http://www.google.com");
print_r($html);
这可行,但是当我用以下代码解析它时,再次出现 500 错误。
$object = new simple_html_dom();
$object->加载($html);
var_dump($object);
-
方法3
然后作为最后的手段,我想我应该尝试使用 curl 然后解析。所以我使用 curl 并确保 curl 正常工作,我在它工作时打印了输出。但是当我再次解析到 simplehtmldom 时,打印输出时出现 500 错误。
[2018 年 9 月 8 日星期六 21:26:19.456961] [:error] [pid 703804] ModSecurity: 输出过滤器:响应体太大(超过 404800001 的限制,总计 未指定)。
我将限制提高了近 100 倍,但仍然是同样的错误。
【问题讨论】:
-
这看起来像是某种递归,文档大小为 404 MB,看起来不像 HTML 文档...
-
试试
$object->load($html); ob_start();var_dump($object);$len=strlen(ob_get_clean());var_dump($len);... -
@hanshenrik 不幸的是同样的 500 错误
-
@arkascha 打得我好。我的意思是我也下载了一个 simplehtmldom 的新文件,以防我因为某种原因弄乱了我的原始文件,但仍然是同样的错误。
-
@SaadBashir 不,我认为这不是同一个错误,这次错误日志是怎么说的?
标签: php curl fopen file-get-contents simple-html-dom