【发布时间】:2014-04-10 18:34:33
【问题描述】:
我想根据列的子集找出两个数据框(df1 中的元素,而不是 df2 中的元素)之间的差异。这两个数据框具有相同的架构。
说 df1 包含
col1 col2 col3 col4
A B C D
A C D D
而 df2 包含
col1 col2 col3 col4
A D D D
A B D D
我想要 df1 中的项目,其中 df2 中没有 col1 和 col2 匹配的项目。所以在这种情况下,预期的输出将只是 df1 的第二行。
A C D D
我尝试了isin 的不同变体,但我很难找到任何可行的方法。我试过 https://stackoverflow.com/a/16704977/1639228 ,但这只适用于单列。
【问题讨论】:
-
为什么说“基于 col1 和 col2”?你的预期输出看起来更像
df1的第二行 -
预期输出是df1的第二行。我的意思是我想要 df1 中的项目,而不是 df2,只查看列 col1 和 col2。