【发布时间】:2021-02-01 02:14:52
【问题描述】:
我是编程新手。我正在网上学习python和pandas。
我是一名 QA,并试图将我的一项手动工作自动化。
我有 2 个数据集。
df1= pd.DataFrame({'number':['c-101','c-102','c-103'],'Summary':['Summary1','Summary2','Summary3']})
df2= pd.DataFrame({'ticket':['c-102','c-103','c-101'],'Summary':['Ticket1','Ticket2','Ticket3'], 'Priority':['High','Low','High']})
df2.ticket 包含与df1.numbers 相似的值,但它被打乱了。
df2 和 df1 长度不同,len(df1) > len(df2)
我正在尝试创建一个新的数据框 (df3),其中:
- 如果
df1.number=df2.ticket exist:使用 df1(行)对应的 df2.Priority(在新列中)中的所有值更新 df3 - 如果
df1.number = df2.ticket不存在:更新"NO PRIORITY"
所以我需要遍历df1.number 来检查每个df2.ticket 是否存在。
我试过了:
for i in df2["ticket"]:
if i in df1["number"]:
ticket.append(df2["Priority"])
else:
ticket.append("NOT CREATED")
输出:df3 包含 Priority = "NOT CREATED" 的所有行(即使对于 df1.number = df2.ticket)
非常感谢社区的任何意见。
【问题讨论】: