【发布时间】:2016-09-17 07:40:05
【问题描述】:
我需要使用 python 脚本从一些字符串中删除表情符号。我发现有人已经问过这个question,并且其中一个答案被标记为成功,即以下代码可以解决问题:
#!/usr/bin/env python
import re
text = u'This dog \U0001f602'
print(text) # with emoji
emoji_pattern = re.compile("["
u"\U0001F600-\U0001F64F" # emoticons
u"\U0001F300-\U0001F5FF" # symbols & pictographs
u"\U0001F680-\U0001F6FF" # transport & map symbols
u"\U0001F1E0-\U0001F1FF" # flags (iOS)
"]+", flags=re.UNICODE)
print(emoji_pattern.sub(r'', text)) # no emoji
我将此代码插入到我的脚本中,并将其更改为仅作用于我的代码中的字符串而不是示例文本。但是,当我运行代码时,我遇到了一些我不明白的错误:
Traceback (most recent call last):
File "SCRIPT.py", line 31, in get_tweets
"]+", flags=re.UNICODE)
File "/usr/local/Cellar/python/2.7.12/Frameworks/Python.framework /Versions/2.7/lib/python2.7/re.py", line 194, in compile
return _compile(pattern, flags)
File "/usr/local/Cellar/python/2.7.12/Frameworks/Python.framework/Versions/2.7/lib/python2.7/re.py", line 251, in _compile
raise error, v # invalid expression
sre_constants.error: bad character range
我明白错误的意思,但自从我从 Stackexchange 获取此代码后,我无法弄清楚为什么它显然对讨论中的人有效,但对我无效。如果有帮助,我正在使用 Python 2.7。谢谢!
【问题讨论】:
-
sys.maxunicode说?
标签: python python-2.7