【发布时间】:2011-02-22 22:40:39
【问题描述】:
好的。诚然,我不是最擅长使用正则表达式。我正在做的是屏幕抓取,然后尝试修复嵌入图像中的 img src 值以指向原始域。这是我一直在尝试的正则表达式(太多无法列出 - 这是当前的):
preg_match_all('/<img\b[^>]*>/i', $html, $images);
这最终会用/> 替换所有<。我需要它做的只是在一个数组中返回页面上的(当前)五个图像,以便我可以与这些图像一起修复它们的 src 值,然后将它们写回 $html,它是在开头设置的文件:
$html = file_get_contents($target_url);
【问题讨论】:
-
您似乎只是想获取 src 属性。 DomDocument 甚至简单的 xml 都不会吗?
标签: php regex html-parsing