【发布时间】:2021-06-09 23:24:54
【问题描述】:
我正在连接两个 pandas 数据帧,它们具有完全相同的列,但行数不同。我想将第一个数据帧堆叠在第二个数据帧上。
当我执行以下操作时,我在某些列中获得了许多 NaN 值。我已经尝试使用post 修复,使用.reset_index
但我仍然得到 NaN 值。我的数据框有以下列:
第一个rem_dup_pre 和第二个rem_dup_po 的形状分别为(54178, 11) (83502, 11)。
我试过这个:
concat_mil = pd.concat([rem_dup_pre.reset_index(drop=True), rem_dup_po.reset_index(drop=True)], axis=0)
我得到 NaN 值。例如,在“Station Type”中,以前在 rem_dup_pre 或 rep_dup_po 中都没有 NaN 值:
如何在没有 NaN 值的情况下简单地连接它们?
【问题讨论】:
-
您能否分享两个数据帧中的一些示例行。我无法重现问题
-
查看How to make good pandas examples 和edit 您的问题,包括minimal reproducible example 示例输入和预期输出作为问题正文中的文本,而不是图片或外部链接
-
试试这个
df = pd.concat([df1,df2]).reset_index(drop=True),而不是你给的。