【发布时间】:2020-04-14 02:31:08
【问题描述】:
我正在尝试寻找一种方法来比较两个数据帧,下面是比较部分的逻辑,例如第一个数据帧 (df1)
order billing_doc gst_invoice_no
2321 938456847 GT8476534
7465 943758465 HG3485634
3475 253426365 GT3475634
2534 215431233 HY8347534
第二个文档示例 (df2)
order_number shipment_number invoice_number final_status
3347 28I4Y348843 GT36543265 Delivered
2376 WEKRUH32343 234U652763 Dispatched
2732 93745874654 HT35426343 Invoiced
5434 34598749R43 HY32562343 Delivered
2344 WUTR7635632 HU35642653 Packed
2331 2343234IUY4 FER3542542 Cancelled
比较这两个数据框的逻辑是:
将 df1 中的 gst_invoice_no 列与 df2 中的 invoice_number 进行比较,如果匹配,则将 df2 中的行绑定到 df1;
如果没有匹配,则将 df1 中的同一列 gst_invoice_no 与 df2 中的 shipping_number 进行比较,如果匹配,则将 df2 中的行绑定到 df1。
我相信我之前的问题有点压倒性。请提出一种实现前两个步骤的方法。
【问题讨论】: