【发布时间】:2014-02-25 15:07:25
【问题描述】:
我有一个抓取价格的网络爬虫,因为我需要它来查找字符串中的以下价格:
- 762,50
- 1.843,75
在我的第一个天真的实现中,我没有采用 .考虑并将第一个数字与此正则表达式完美匹配:
re.findall("\d+,\d+", string)[0]
现在我需要匹配这两种情况,我最初的想法是这样的:
re.findall("(\d+.\d+,\d+|\d+,\d+)", string)[0]
有一个想法,使用 or 运算符,可以找到第一个或第二个,这不起作用,有什么建议吗?
【问题讨论】:
-
不应该
1.843,75是1,843.75吗? -
不在丹麦 :) 它相当于一千八百棵丹麦克朗和七十五欧尔(相当于美分)
-
如果您尝试使用正则表达式解析 HTML,请参阅 stackoverflow.com/questions/1732348 :)
标签: python regex python-2.7