【发布时间】:2013-04-17 14:13:57
【问题描述】:
我正在解析我网站上的各种 html 页面。我希望删除一些特定的“a”标签。 所有的标签都是这样的:
<a href="#cite-note-2"><span>..</span></a>
<a href="#cite-sub">....</a>
所以我想要的是删除所有href以#cite开头的标签
请在 php 中建议一些正则表达式。谢谢
【问题讨论】:
-
没有。在 HTML 上使用正则表达式,尤其是用于操作,是一个坏主意。请改用DOM。
-
正则表达式通常可以很好地从尖括号交叉的文本中提取(而不是“解析”)。然而,它们不适合新手。如果你不知道正则表达式,你不应该尝试它。此外,不要要求互联网提供神奇的黑匣子代码来做到这一点。 -- 更简单的解决方案是 phpQuery 或 QueryPath;但是,是的,仍然需要您进行一些研究。
标签: php html-parsing