【发布时间】:2011-04-29 09:59:41
【问题描述】:
我需要一个正则表达式,它可以在 href 标记内和引号内提供字符串。
例如,我需要在以下内容中提取 theurltoget.com:
<a href="theurltoget.com">URL</a>
此外,我只想要基本 url 部分。 IE。来自http://www.mydomain.com/page.html 我只想要http://www.mydomain.com/
【问题讨论】:
-
一般共识:不要使用正则表达式解析 HTML。
-
好的,我怎样才能得到href标签然后使用php
-
您的数据甚至不包含方案。
href可能并不总是包含方案和域。 -
不要使用正则表达式解析 HTML。使用适当的 HTML 解析模块。 您无法使用正则表达式可靠地解析 HTML,并且您将面临悲伤和挫败感。一旦 HTML 与您的期望发生变化,您的代码就会被破坏。有关如何使用已经编写、测试和调试的 PHP 模块正确解析 HTML 的示例,请参阅 htmlparsing.com/php。
标签: php regex html-parsing