【发布时间】:2012-02-12 01:09:13
【问题描述】:
我有一个单词字典列表,其中一些单词包含如下序列:
K\xc3\xb6LN 或 KöLN 正确显示时。
我想清除此类单词的列表,以便它们仅包含纯 ascii 字符。如何进行简单的 True/False 检查以查看字符串是否包含此类序列?
【问题讨论】:
-
哪些 ASCII 字符是普通字符?使用 Unicode 有什么可怕的?您是否愿意将其更改为“KoLN”并保留它?
-
@JohnMachin 这是一个字典攻击实验。单词取自 /usr/share/dict
标签: python string unicode escaping