【发布时间】:2013-10-04 17:43:06
【问题描述】:
我在 linux 上的文本文件中遇到一个特殊符号。我实际上成功地将它粘贴在以下字母“aa”之间(我在 Geany 中的光标停止但没有显示任何字符)。
我想知道获取其 utf8 代码(形式为 U+0000)的最简单方法是什么。我正在使用 ubuntu 和 geany,我在包含它的文件上尝试了 hexdump,但我显然遗漏了一些东西。
【问题讨论】:
-
不要混淆 Unicode 代码点和它们的 UTF-8 表示。例如,U+0410 是首都西里尔字母 A,但其 UTF-8 表示为 0xD0 0x90。
-
谢谢,我想知道如何在 grep 正则表达式中使用 unicode 代码,结果我需要一个字节一个字节的 UTF-8 表示(因为我猜我的文件使用 utf-8)。无论如何,叮咬是:0xE2 0x80 0x8F