【发布时间】:2017-04-26 12:54:25
【问题描述】:
我要合并两个 DataFrame:
DataFrame A columns: index, userid, locale (2000 rows)
DataFrame B columns: index, userid, age (300 rows)
当我执行以下操作时:
pd.merge(A, B, on='userid', how='outer')
我得到了一个包含以下列的 DataFrame:
索引、未命名:0、用户 ID、语言环境、年龄
index 列和 Unnamed:0 列是相同的。我猜Unnamed:0 列是DataFrame B 的索引列。
我的问题是:在合并两个 DF 时,有没有办法避免 Unnamed 列?
之后我可以删除Unnamed 列,但只是想知道是否有更好的方法。
【问题讨论】:
-
你试过设置 index = False 吗?这里有一个很好的讨论:stackoverflow.com/questions/36519086/…
-
@datawrestler 合并没有索引参数。 (to_csv 有但不合并)
-
对,但是如果你在读取每个 DF 时设置标志然后合并可能会这样做
-
你能分享一个数据集的样本和用于合并的代码吗?我相信我们可以找到解决方案!
-
@Cheng,我只能查看 Pandas 版本 0.7.0 - 它已经有
index参数 - pandas.pydata.org/pandas-docs/version/0.7.0/generated/…