【发布时间】:2016-12-18 23:02:34
【问题描述】:
我在我的 Python 程序中使用国际音标 (IPA) 符号,这是一组相当奇怪的字符,其 UTF-8 代码的长度范围为 1 到 3 个字节。几年前的This thread 基本上问了相反的问题,似乎ord(character) 可以检索一个十进制数,我可以将其转换为十六进制,然后转换为代码点,但ord() 的输入似乎仅限于一个字节。如果我在任何非 ASCII 字符上尝试 ord(),例如 ɨ,它会输出:
TypeError: ord() expected a character, but a string of length 2 found
由于不再是选项,Python 2.7 中是否有任何方法可以找到给定字符的 Unicode 代码点? (那么该字符是否必须是 unicode 类型?)我的意思也不是仅在 Unicode 表上手动查找它。
【问题讨论】:
标签: python python-2.7 unicode