【发布时间】:2016-06-20 10:14:51
【问题描述】:
我怎样才能在输出中摆脱这些u?
正则表达式:
Tregex1 = "1?\W*([2-9][0-8][0-9])\W*([2-9][0-9]{2})\W*([0-9]{4})(\se?x?t?(\d*))?"
代码:
for a in re.findall(Tregex1,text_value,re.IGNORECASE):
print a
输出:
(u'877', u'638', u'7848', u'\n', u'')
(u'650', u'627', u'1000', u'\n', u'')
(u'650', u'627', u'1001', u'\nE', u'')
(u'312', u'273', u'4100', u'', u'')
我尝试使用这些并关注了几个类似的links
a.encode('ascii', 'ignore')
a.encode('utf-8')
",".join(a)
但它们都不起作用。
预期输出:
877-638-7848
650-627-1000
650-627-1001
312-273-4100
我正在使用 Python 2.7
也有人可以解释一下,为什么我有时会得到 \n 而 \nE 否则甚至是空白?
【问题讨论】:
-
您不必担心
u前缀,它只会告诉您字符串是Unicode。 -
@downvoter 原因好吗?