【发布时间】:2011-11-23 22:54:18
【问题描述】:
不幸的是,我在使用 php sax 解析器和 utf-8 编码时遇到了一些问题。
案例:
我有一个用 utf-8 编码的 xml 文件。该文件使用标准的 php sax 解析器进行解析。数据存储到一些容器对象中并插入到 mysql 数据库中。不幸的是,数据库中的某些字符看起来很奇怪(主要是德语变音符号)。例如,Gürtel 看起来像 Gürtel。
以下代码片段显示了解析器是如何实例化的:
$saxParser = xml_parser_create("UTF-8");
这足以解析 utf-8 文件吗?如果是,我错过了什么?插入时有一些特殊的数据库内容?
提前致谢。
【问题讨论】:
-
你的数据库文本列有什么排序规则?您是否使用“SET NAMES 'UTF8'”将 MySQL 编码设置为 UTF-8?
-
@ZombieHunter 我的排序规则是 utf8_general_ci