【发布时间】:2015-07-09 16:54:47
【问题描述】:
我正在使用 python 正则表达式来查找字符串中的所有价格。到目前为止,我只是在正确管理符号时遇到了麻烦。
这段代码,输入:'happy$37.54000happy$34$3454$3333€27.80€3.00.33.2£27.000'
import sys
import re
price = sys.argv[1]
new = re.findall(r'[\$\20AC\00A3]{1}\d+\.?\d{0,2}',price,re.UNICODE)
for prices in new:
print prices
输出:
$37.54
$34
$3454
$3333
我想要的是:
$37.54
$34
$3454
$3333
€27.80
€3.00
£27.00
如果我将欧元符号添加到代码中,则文件无法编译,因为它不是 unicode 字符。我在想,因为20AC 是欧元符号的 unicode,\00A3 是英镑符号的 unicode,所以它可以工作,但它没有。
我认为问题在于这部分代码:...
[\$\20AC\00A3]...
任何帮助将不胜感激
为未来的人编辑 - 这是最好的代码答案:
# -*- coding: utf-8 -*-
import sys
import re
price = sys.argv[1]
new = re.findall(r'[$€£]{1}\d+\.?\d{0,2}',price,re.UNICODE)
for prices in new:
print prices
【问题讨论】:
-
-
假设句点后面总是跟着两位数字是否安全?
-
如果将
r'更改为ur'会怎样? -
感谢kirby的建议,可惜没用。
-
谢谢 Jason,说得好,我已将其更改为 [\$\20AC\00A3]{1}\d+\.?\d{2}? (这并不能解决问题,但我认为从长远来看是更好的代码)