【发布时间】:2019-03-17 22:23:00
【问题描述】:
我是 python 新手。我正在尝试使用正则表达式从子字符串中提取以美元计价的金额。它在大多数情况下都有效,但是我面临着一些我无法解决的问题。
结果金额是一个字符串,由于逗号而无法识别为金额。它也不适用于小于$1(例如0.89)的小额金额。没有前导$。非常感谢任何帮助。
这是我所拥有的:
df['Amount']=df['description'].str.extract('(\d{1,3}?(\,\d{3})*\.\d{2})')
这是一个应该被解析的字符串:
000000000463 NYC DOF OPA CONCENTRATION ACCT. *00029265 07/01/2013 AP5378 1,107,844.38 Ven000000000463 Vch:00029265
我正在尝试在数据框对象的单独列中提取金额 1,107,844.38。我没有任何应该被拒绝的字符串。
【问题讨论】:
-
能否请您发布应该解析的字符串和应该拒绝的字符串?
-
当然,这是一个应该被解析的字符串。我正在尝试在数据框对象的单独列中提取金额 1,107,844.38。我没有任何应该被拒绝的字符串。谢谢! “000000000463 NYC DOF OPA 浓度帐户。*00029265 07/01/2013 AP5378 1,107,844.38 Ven000000000463 Vch:00029265”
-
你能用它更新你的问题吗?谢谢!