【发布时间】:2011-10-28 07:58:07
【问题描述】:
可能重复:
How to parse HTML with PHP?
crawling a html page using php?
我正在尝试找到一种方法来查找 html 标签。
所以我尝试使用 preg_match_all 函数来查找 html 标签。
这是我使用的代码:
$code = "<div>This is a test</div>";
preg_match_all("/(<[^<>]+>)([^<>]+)(<[^<>]+>)/",
$code, $matches);
var_dump($matches);
当我使用此代码时,我尝试运行它.. 页面返回
数组(4) { [0]=> 数组(1) { [0]=> 字符串(25) " 这是一个测验 " } [1]=> 数组(1) { [0]=> 字符串(5) " " } [2]=> array(1) { [0]=> string(14) "这是一个测试" } [3]=> array(1) { [0]=> string(6) " " } }
正如您在数组中看到的那样。未检测到 <div> 和 </div>。
你能帮帮我吗? ,并告诉我问题到底出在哪里。
对不起我的英语..
谢谢,
【问题讨论】:
-
不要使用正则表达式:stackoverflow.com/questions/1732348/…
-
@Corey Ogburn 我想使用正则表达式这是我想做的事情所必需的......谢谢和抱歉
-
@gpojd 这个主题不使用正则表达式..我想在我的网站上做的事情需要正则表达式..
-
你只是很固执,使用 HTML DOM PARSER(例如:simplehtmldom.sourceforge.net)而不是正则表达式来解析 html。 IMO 顽固的人不值得帮助。
标签: php regex preg-match