【发布时间】:2021-06-09 15:38:48
【问题描述】:
我很想知道是否有人对如何在 Python 中使用 Pandas 完成此任务有任何想法。
我有一个数据框 (df1),其中包含信用卡交易详情,其中包含销售点描述 (df1['Description']) 和金额 (df1['amount'])。每个位置的 POS 描述都是唯一的,因此您最终会得到多个关于 Amazon、Shell Oil 等的描述。
我有另一个数据框 (df_lookup) 将用作查找表来对事务进行分类。此数据框将包含名称 (df_lookup['Name']) 和用于对每个事务进行分类的类别 df_lookup['Category'])。
这是我想要完成的: 比较 df1['Description'] 和 df_lookup['Name']。如果 df1['Description'] 包含 df_lookup['Name'],则相应的 df_lookup['Category'] 将作为新列 df1['Category'] 添加到 df1。请在下面查看每个数据框的示例和所需的结果。
df1 示例:
| Description | Amount |
|---|---|
| AMAZON.COM*ajlja09ja AMZN.COM | 10 |
| AMZN Mktp US *ajlkadf | 15 |
| AMZN Prime *an9adjah | 20 |
| Shell Oil 4106541031 | 20 |
| Shell Oil 4163046510 | 25 |
df_lookup 示例:
| Name | Category |
|---|---|
| AMAZON | Amazon |
| AMZN | Amazon |
| Shell Oil | Gas |
想要的输出到 df1:
| Description | Amount | Category |
|---|---|---|
| AMAZON.COM*ajlja09ja AMZN.COM | 10 | Amazon |
| AMZN Mktp US *ajlkadf | 15 | Amazon |
| AMZN Prime *an9adjah | 20 | Amazon |
| Shell Oil 4106541031 | 20 | Gas |
| Shell Oil 4163046510 | 25 | Gas |
【问题讨论】:
-
不要粗鲁,但你在上一个 DataFrame 中拼错了类别
-
大声笑,文字很难!谢谢
-
yw pardner @bbalch