【发布时间】:2013-11-09 11:17:16
【问题描述】:
我原以为这是一个简单的正则表达式,但我想今天早上我的脑袋并没有搞砸!
我正在获取一个页面的源代码并用一堆其他 preg_replaces 整理它,所以当我们到达下面的正则表达式时,结果已经是一个单行字符串,其中去除了诸如 cmets 之类的东西,等等
我现在要做的就是修剪 > 和
<p> hello world </p>
应该变成
<p>hello world</p>
我认为这可以解决问题,但它似乎什么也没做?
$data = trim(preg_replace('/>(\s*)([^\s]*?)(\s*)</', '>$2<', $data));
干杯。
【问题讨论】:
-
不要使用正则表达式进行整理。使用
HTMLTidy。 -
我不只是整理 - 我正在删除 doctype、head、scripts、cmets 等。HTMLTidy 更快吗?
-
@Ric,你检查我的答案了吗?