【发布时间】:2012-01-12 18:52:40
【问题描述】:
大家好,经过 5 个小时的研究并尝试了一切,我非常绝望,所以我写在这里。
我有一个来自第三方的 XML 文件。当我尝试使用SimpleXMLElement 解析它时,它只是说该字符串不是有效的 XML 格式,我还发现这是由于 XML 文件具有 ANSI 编码而发生的。我尝试将文件转换为 UTF-8 -> 它被解析器读取,但我所有的西里尔符号都丢失了,取而代之的是无意义的字符。
然后在记事本++中,我复制了内容,创建了一个使用utf8编码的文件并粘贴了内容->它很好,并被解析器读取。我试图用代码来做,但没有结果->我得到文件的内容,创建一个包含第一个字节的文件,UTF-8文件的字节,输出内容,当我打开它时->无意义的字符而不是西里尔字母。请帮助我,我真的需要将此文件转换为对 XML 解析器有效的 UTF-8,或者您能否告诉我另一种将文件从 XML 解析为数组的方法。
【问题讨论】:
-
你应该早点想到 ;) 如果你在浏览器中打开 xml 文件会发生什么,你会得到一个解析错误吗?
-
你知道原始文件是用什么编码的吗? iso8859-5?
-
它没有在 chrome 和 IE9 中打开。记事本说编码是ANSI,我不知道……
-
不能是 ANSI,ANSI 不支持西里尔字符。你能把原始文件上传到某个地方,让我们看看吗?