【发布时间】:2018-05-21 19:54:59
【问题描述】:
我正在尝试抓取一些特定数据并将它们输出到我的站点中。
我在 PHP 中使用 Curl,这是我尝试使用的正则表达式,但它给了我一个错误致命错误:允许的 ram 字节的内存大小耗尽 这意味着它需要很多文件。
代码:
preg_match_all('!<th scope="(\b[a-zA-Z]+\b)">(\b[a-zA-Z]+\b)<\/th><td><a href="\/wiki\/(\b[a-zA-Z]+\b)" title="(\b[a-zA-Z]+\b)">(\b[a-zA-Z]+\b)<\/a>!',$result,$cap_matches);
$cap_name = array_values(array_unique($cap_matches[0]));
echo $cap_name[0];
我试图只制作“a ...”标签的正则表达式,但我得到了很多结果,我只想抓住资本。
【问题讨论】:
-
你尝试过使用 PHP Xpaths 吗?
-
您必须发布代码才能获取 URL 内容,这是该错误的原因。
-
@dGRAMOP 不,我没有,但我现在就去看看。
-
@AbraCadaver 我知道使用正则表达式我无法解析 html 标签等。但是对于使用正则表达式的特定示例有什么解决方案吗?