【发布时间】:2019-10-23 00:31:26
【问题描述】:
我正在比较两个 df,当使用 .equals() 时它给了我False,但是如果我将两个 df 附加在一起并使用 drop_duplicate() 它什么也没给我。有人可以解释一下吗?
【问题讨论】:
-
“假”不是意味着2个数据集中没有重复吗?因此“drop_duplicate()”不会返回任何内容。
-
您需要提供minimal reproducible example。我可以保证
.drop_duplicates()不应该返回一个空的DataFrame,除非你从一个空的DataFrame 开始,或者指定keep=False -
这个问题太宽泛了。
-
是的,我使用了 'keep=False',只剩下列索引,不确定我这样做是否正确,我会在晚餐后尝试获得一个最小的可重现示例。
-
@PySeeker 我认为 '.equals()' 中的 'False' 表示不同,而 ''True'' 表示两个文件相同
标签: python pandas dataframe comparison