【发布时间】:2016-05-06 23:19:49
【问题描述】:
我正在尝试拆分包含元音变音 ä(德语字符)的字符串,但拆分后它是编码的元音变音字符。请看下文。
>>> k = 'A|B|C|AT|Dxbensäce|S|'
>>> re.split('\|\w+\|',k)
['A', 'C', 'Dxbens\xc3\xa4ce', '']
我需要得到如下输出:
['A', 'C', 'Dxbensäce', '']
请提出建议。
我需要再补充一点。
我需要将上面的字符串拆分并存储到列表中,并将此值与其他列表值进行比较(将相同的值添加到第二个列表中)。
由于第一个列表值转换为 unicode 比较失败。
注意:这里我没有打印值。我知道通过使用 print 我会得到正确的变音符号值。
第一个列表值使用拆分语句填充,第二个列表值应为硬编码值。
【问题讨论】:
标签: python python-2.7 unicode