【发布时间】:2022-01-17 00:22:16
【问题描述】:
我有以下数据框,df:
name result
AAA 4.5
BBB UNK
CCC less than 2.45
DDD Men > 40: 2.5-3.5
result 列的dtypes 是dtype('O')
我需要提取浮点值并使用特定阈值对其进行过滤。
我尝试了以下脚本来提取值并将它们更改为浮点数:
df['result'] = df['result'].str.extract(r'(\d+.\d+)').astype('float')
但是,我不确定我是否得到了正确的输出,尤其是当值的范围为2.5-3.5 时。在这种情况下,我想要最大值,i.e. 3.5。
期望的输出:
name result
AAA 4.5
CCC 2.45
DDD 3.5
最聪明的做法是什么?任何建议,将不胜感激。谢谢!
【问题讨论】:
标签: python pandas string dataframe data-manipulation