【问题标题】:Getting specific HTML from a webpage with PHP [duplicate]使用 PHP 从网页获取特定的 HTML [重复]
【发布时间】:2012-07-17 19:52:27
【问题描述】:

可能重复:
How to parse and process HTML with PHP?

我正在学习 PHP,当我必须从没有可用 API 的网页中提取(解析)一些数据时,我使用正则表达式或获取两个字符串之间的字符串的函数。

我想知道是否有更“专业”、更简单的方法来做到这一点,因为 regexp 是资源消耗,而不是现在对我来说最容易编写的东西。

【问题讨论】:

  • 步骤1.获得网站所有者的许可...
  • 我建议删除正则表达式标签,因为它不适用。

标签: php regex parsing html-parsing


【解决方案1】:

您永远不应该尝试使用 regular-expressions 解析 XML (html),而是为自己准备一个合适的 XML 解析器库并以正确的方式进行。我可能听起来像是一项艰巨的任务,但你最终会感谢自己。

可以使用以下任一资源或类似资源进行解析。


关于 html 和 正则表达式的流行和传奇答案,值得一读的诗歌:

【讨论】:

  • 我刚刚收到了反对票,有人愿意解释原因吗?
【解决方案2】:

PHP 带有一个默认的 XML 解析库,供您在这种特定情况下使用。使用file_get_contents 来检索 HTML 页面并进行相应的解析。

XMLhttp://php.net/manual/en/book.xml.php

file_get_contentshttp://php.net/manual/en/function.file-get-contents.php

【讨论】:

    猜你喜欢
    • 2012-07-19
    • 1970-01-01
    • 2012-02-27
    • 2012-04-21
    • 1970-01-01
    • 2016-02-03
    • 2017-01-16
    • 2014-06-11
    • 1970-01-01
    相关资源
    最近更新 更多