【发布时间】:2010-12-13 19:21:38
【问题描述】:
您如何处理 XML 文件中的损坏数据?例如,如果我有
<text>Some &improper; text here.</text>
我正在努力:
$doc = new DOMDocument();
$doc->validateOnParse = false;
$doc->formatOutput = false;
$doc->load(...xml');
它惨遭失败,因为有一个未知实体。注意,由于软件的编写方式,我不能使用 CDATA。我正在编写一个读写 XML 的模块,有时用户会插入不正确的文本。
我注意到 DOMDocument->loadHTML() 可以很好地编码所有内容,但我该如何从那里继续呢?
【问题讨论】:
-
loadHTML() 有什么问题?据我了解,它是为这样的情况而设计的。
-
“从那里继续”是什么意思?
-
实际生成 XML 的软件已严重损坏,您应该尝试更改它 - 或联系有能力的人。
标签: php xml parsing syntax entities