【发布时间】:2016-05-26 01:19:02
【问题描述】:
我在 Python 2 中工作,我有一个包含表情符号以及其他 unicode 字符的字符串。我需要将其转换为列表中的每个条目都是单个字符/表情符号的列表。
x = u'????????xyz????????'
char_list = [c for c in x]
想要的输出是:
['????', '????', 'x', 'y', 'z', '????', '????']
实际输出为:
[u'\ud83d', u'\ude18', u'\ud83d', u'\ude18', u'x', u'y', u'z', u'\ud83d', u'\ude0a', u'\ud83d', u'\ude0a']
我怎样才能达到想要的输出?
【问题讨论】:
-
我已将其作为超集问题的副本关闭。仔细阅读他们的答案。如果仍然不能解决您的问题,请edit 发帖以包含您的其他尝试。
-
我的问题与另一个问题不同,因为我正在处理包含表情符号和非表情符号字符的字符串。另外,我对计算表情符号不感兴趣,而是对获取所有字符的列表感兴趣。
-
字符串输入有 7 个字符,将 emoji 记为单个字符。我得到的输出列表中有 11 个条目。我需要得到一个输出列表,其中包含与输入字符串中的字符相对应的 7 个条目。
-
@ivan_pozdeev:它必须是 Python 2,因为实际输出使用
u'...'字符串文字来表示值。然后确实强调了这个问题缺少实际的minimal reproducible example。要么缺少from __future__ import unicode_literals,要么缺少x字符串定义上的u前缀。
标签: python unicode python-2.x emoji