【发布时间】:2011-03-02 20:22:19
【问题描述】:
我的一个项目从网络上提取一个文档并阅读它。本文档由第三方提供,不会更改(内容会更改,但格式和其他内容不会更改)。 问题是该文档包括从 Word 中复制和粘贴的内容,即 UTF-8,但是该文档以 ISO-8858-1 编码,因此这些字符以“?”的形式保存到数据库中。
如果我跳过文本,然后用 UTF-8 重新编码,而不是得到智能引号和破折号,我只会得到两个垃圾字符。
如何将这个带有 UTF-8 字符的 ISO-8859-1 文档转换回 UTF-8,以便它可以像最初创建的那样显示?
【问题讨论】:
标签: php utf-8 iso-8859-1