【发布时间】:2010-07-15 18:08:06
【问题描述】:
我似乎完全无法绕过 utf-8 字符编码。
所以我将数据库中的内容导出为 utf-8 xml 文件。 我正在导入的软件对字符编码非常严格,所以我不能将所有内容都放在CDATA标签中。
有一大堆奇怪的字符,例如’,——……已经在数据中了。
这些在 xml 中不起作用,需要替换掉(通常只用一个 ' 引号)。
理想情况下,我想解码所有字符,然后使用 htmlspecialchars($text, ENT_COMPAT, 'UTF-8', FALSE) 将它们重新编码回来。但我似乎找不到可以解码它们的函数。有吗? 我已经开始使用 str_replace() 手动检查每个实体,但这比我预期的要大得多。
任何帮助都是救命稻草。 谢谢
【问题讨论】:
标签: php utf-8 character-encoding