【发布时间】:2009-08-02 04:15:00
【问题描述】:
我正在使用以 UTF-8 编码的 Wikipedia XML 转储。现在,我正在以 std::string 的形式读取所有内容,因此当我将 std::cout 显示到屏幕上时,外来字符显示为乱码。
虽然实际的解析过程只查找 ASCII 字符,但是当我将解析后的文件写入磁盘时,我想保留外来字符。换句话说,我希望输出与输入具有相同的编码。
使用 std::string 可以吗,还是我必须使用 ICU 之类的东西?我看过的图书馆似乎过于复杂。有什么东西可以快速完成吗?
【问题讨论】: