【发布时间】:2019-06-29 07:43:44
【问题描述】:
我有两个熊猫数据框。假设第一个是master
ID COL1 COL2
1 A AA
2 B BB
3 C CC
4 D DD
还有一个source
ID COL1 COL2
1 A ZZ
2 B BB
3 YY CC
5 G GG
6 H HH
显然长度可能不同,并且差异可能不止一列。但是,结构将是相同的。我想在source 中找到新的或不同于master 中可用的记录。也就是说,我要找的输出是一个数据框:
ID COL1 COL2
1 A ZZ
3 YY CC
5 G GG
6 H HH
我尝试了以下解决方案:
- Outputting difference in two Pandas dataframes side by side - highlighting the difference
- Comparing two dataframes and getting the differences
但这些似乎都不适合我。这基本上是试图找出新的东西。
【问题讨论】:
-
ID一定要一样,还是没关系?
-
类似于this 的反面 - 这些答案可能会对您有所帮助