【发布时间】:2011-09-26 17:07:57
【问题描述】:
我现在在处理项目时遇到过几次问题,我想知道是否有一个优雅的解决方案。
问题 我正在通过 XML 从 twitter 中提取推文并将它们上传到我的数据库,但是当我将它们输出到屏幕时,我得到了这些字符:
“搬到杜塞尔多夫。â��” 要么 坦比安
如果我有俄语字符,那么我会得到很多丑陋的盒子。
我想要的是在一种编码下显示正确的本地口音。我认为使用 UTF-8 是可能的。
我正在使用什么
- PHP、MYSQL
读入 XML 文件后,我将执行以下操作来清理数据:
$data = trim($data);
$data = htmlentities($data);
$data = mysql_real_escape_string($data);
我的数据库排序规则是:utf8_general_ci
网页字符集为:charset=UTF-8
我认为这可能与 HTML 实体有关,但我真的很欣赏一个在项目中全面运作的解决方案。
提前致谢。
【问题讨论】:
标签: php mysql xml character-encoding html-entities