【问题标题】:Extended ASCII in C++C++ 中的扩展 ASCII
【发布时间】:2021-04-28 17:14:26
【问题描述】:

我已尝试执行以下代码:

    #include <iostream>
using namespace std;

int main() {
    unsigned char datoChar = 168;
    cout << datoChar << endl;
    return 0;
}

它返回一个带有“?”的符号但它应该返回“¿”

【问题讨论】:

  • 这完全取决于终端中的代码页和 Unicode 支持
  • @phuclv 是对的。我想如果你尝试任何其他扩展 ascii,那么也许其中一些也会变成?
  • 使用wcout 代替:wchar_t datoChar = L'¿'; wcout &lt;&lt; datoChar &lt;&lt; endl; 如果仍然有问题,请检查控制台的字符集。 StackOverflow 上有大量与 Unicode 控制台输出相关的问题。

标签: c++ ascii extended-ascii


【解决方案1】:

您尚未指定您在哪个平台上以及当前的locale 是什么,但很可能如果您在类 Unix 操作系统上运行,终端将字符解释为 UTF- 8 而不是cp437。 CP437、CP1252 和扩展 ASCII 现在大多已过时,仅用于类似 DOS 的终端,例如 Windows 的cmd.exe。您可以尝试在 CMD.EXE 中使用CHCP 命令切换到 CP437。

在 UTF-8 中,0x7f 上的所有字节都被视为保留,因为它们用于实现多字符编码。在 UTF-8 中,“¿”是代码点 U+00BF,跨越两个单独的字节。

您可以使用十六进制的\uXXXX 表示法将其指定为文字,例如在

std::cout << "\u00BF" << std::endl;

【讨论】:

  • 在 UTF-8 中,所有超过 0x79 的字节都被认为是保留的 不应该是 0x7f 吗? UTF-8 的多字节序列由所有字节中设置的最高有效位标记。因此,它们变为 >= 0x80。因此,0x7f 是没有多字节序列编码的最高值。
  • @Scheff 是的,你是对的。我从 0x80 中减去 1,我写的是 79 而不是 7f...
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-07-31
  • 1970-01-01
  • 2015-05-15
相关资源
最近更新 更多