【问题标题】:ValueError when trying to find the difference between two dataframes尝试查找两个数据帧之间的差异时出现 ValueError
【发布时间】:2017-08-29 20:09:17
【问题描述】:

这是我比较两个 xlsx 文件之间差异的代码:

import pandas as pd

df1 = pd.read_excel('SnapshotID_Old.xlsx')
df2 = pd.read_excel('SnapshotID_New.xlsx')

difference = df1[df1 != df2]
print difference

它给了我这个错误:

ValueError: Can only compare identically-labeled DataFrame objects

缺少什么?

【问题讨论】:

  • 看起来你的数据框有不同的标题。
  • @cᴏʟᴅsᴘᴇᴇᴅ 你能详细说明一下吗?
  • 如果您在此处粘贴一些数据,我可以详细说明。
  • @cᴏʟᴅsᴘᴇᴇᴅ 两个文件都包含 100 个条目。关于如何解决此问题的任何提示?

标签: python excel pandas dataframe diff


【解决方案1】:

您可能已经解决了这个问题,但正如COLDSPEED 所说,您的 Excel 中可能有不同的标题。

您可以尝试改用eqne flexible comparison methods

import pandas as pd

df1 = pd.read_excel('SnapshotID_Old.xlsx')
df2 = pd.read_excel('SnapshotID_New.xlsx')

difference = df1[df1.ne(df2)]
print difference

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2018-07-16
    • 1970-01-01
    • 2019-06-19
    • 1970-01-01
    • 1970-01-01
    • 2016-07-21
    • 2014-08-05
    • 1970-01-01
    相关资源
    最近更新 更多