【问题标题】:PHP Simple HTML DOM Parser denies to handle [invalid] HTML - first trial failsPHP Simple HTML DOM Parser 拒绝处理 [invalid] HTML - 第一次试用失败
【发布时间】:2011-09-01 03:06:19
【问题描述】:

亲爱的社区-大家好!

好吧,我正在尝试使用 PHP Simple HTML DOM Parser 选择一个类或一个 id,但绝对没有运气。也许我必须一次又一次地研究联机帮助页。

嗯 - DOM 技术有点超出我的想象: 但是我的示例非常简单,并且似乎符合手册中给出的示例(simplehtmldom.sourceforge AT net/manual.htm),但它不起作用,它让我陷入困境。使用简单 dom 给出的其他示例脚本工作正常。

查看示例:http://www.aktive-buergerschaft.de/buergerstiftungsfinder

这是我找到的最简单的例子......问题是 - 如何解析它?

我应该用 Perl 来做吗?示例 HTML 页面是无效的 HTML。 我不知道 Simple HTML DOM Parser 是否能够处理格式错误的 HTML (可能不是)。然后我迷路了。

嗯:这很难相信 - 但您可以使用 file_get_contents 获取内容:但之后您必须执行解析器工作!我还有一些缺失的部分!

最后:如果我不能让它运行,我可以尝试一些 Perl 解析器,例如 HTML::TreeBuilder::XPath

【问题讨论】:

  • 什么不起作用?你能显示一些代码吗?
  • 你好 Fosco 你好 Pekka,这很难相信 - 但你可以使用 file_get_contents 获取内容:但之后你必须执行解析器工作!还有一些缺失的部分! Pekka 和 Fosco - 你能帮我一下吗!?

标签: php html perl parsing dom


【解决方案1】:

1:检查file_get_contents是否工作!!!

2:如果不使用 curl 或 fopen 或 telnet 读取数据。

简单的 Html Dom 过滤所有噪音也可以处理格式错误的标签...

问题可能与您的数据检索有关

【讨论】:

    猜你喜欢
    • 2011-05-20
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2016-11-26
    • 2019-09-21
    • 1970-01-01
    • 2011-09-04
    相关资源
    最近更新 更多