【发布时间】:2011-03-14 07:53:43
【问题描述】:
PHP(simple html dom/etc..)背景和网页的其他图片应该如何解析?
案例1:内联css
<div id="id100" style="background:url(/mycar1.jpg)"></div>
案例2:html页面内的css
<div id="id100"></div>
<style type="text/css">
#id100{
background:url(/mycar1.jpg);
}
</style>
案例 3:单独的 css 文件
<div id="id100" style="background:url(/mycar1.jpg);"></div>
external.css
#id100{
background:url(/mycar1.jpg);
}
案例4:img标签内的图片
案例 4 的解决方案,正如他在 php simple html dom parser 中出现的那样:
// Create DOM from URL or file
$html = file_get_html('http://www.google.com/');
// Find all images
foreach($html->find('img') as $element)
echo $element->src . '<br>';
请帮我解析案例 1,2,3。
如果有更多案例,请写出来,如果可以的话,请提供解决方案。
谢谢
【问题讨论】:
-
使用 DOM 之类的库从 HTML 文件中获取内容之前已经回答了很多次(包括今天)。 SGML/XML 库不能处理外部 CSS 文件。另请注意,节点内容只是这些库的字符数据。如果要将内容解析为 CSS,则必须找到额外的解析器。
标签: php parsing html-parsing simple-html-dom