【问题标题】:Compare two pandas data frames and get differences [closed]比较两个熊猫数据框并获得差异[关闭]
【发布时间】:2020-05-10 03:26:07
【问题描述】:

我目前有两个熊猫数据框。

df1 :- 解析 excel 并在数据框中获取数据并将其插入 Postgresql db。

df2:- 在数据框中获取 Postgresql 表。

现在我想比较这两个数据帧,并在将 df1 与当前 DB(df2) 进行比较时仅更新 df1 中已更改单元格的 DB。

有人能告诉我怎么做吗?

【问题讨论】:

    标签: python pandas postgresql sqlalchemy


    【解决方案1】:

    你可以试试:

    df_diff=pd.DataFrame()
    for column in df1.columns:
        df_diff[column]=~df1.column.isin(df2[column])
    df1.where(df_diff, inplace=True)
    

    【讨论】:

    • df 是 df1。对不起这个错误。请注意,df1 的所有列名都应该在 df2 中并且具有相同的名称
    • 我收到错误“AttributeError: 'DataFrame' object has no attribute 'column'”
    • df_diff[column]=~df1[column] .isin(df2[column])
    • 非常感谢!现在我知道了哪个特定的单元格被更改了,我如何更新 db 中更改的单元格?我的意思是如何迭代?
    猜你喜欢
    • 2013-11-23
    • 1970-01-01
    • 1970-01-01
    • 2019-06-29
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2023-03-19
    相关资源
    最近更新 更多