【发布时间】:2018-10-30 11:03:42
【问题描述】:
我想在索引上合并两个数据框,并且只想返回合并后存在的不同列。
目前,我正在使用 - pd.merge(X_train, all_data, left_index=True, right_index=True), 合并。但是通过将 _x 和 _y 附加到列名的末尾以进行标识,将返回所有列。
我只需要不同的列。
谢谢!
【问题讨论】:
标签: python python-3.x pandas dataframe merge
我想在索引上合并两个数据框,并且只想返回合并后存在的不同列。
目前,我正在使用 - pd.merge(X_train, all_data, left_index=True, right_index=True), 合并。但是通过将 _x 和 _y 附加到列名的末尾以进行标识,将返回所有列。
我只需要不同的列。
谢谢!
【问题讨论】:
标签: python python-3.x pandas dataframe merge
您可以尝试在合并之前提取不同的列,然后将它们显式传递给合并命令:
X_train_cols = X_train.columns
all_data_cols = all_data.columns
all_data_cols_new = list(set(all_data_cols).difference(X_train_cols))
然后:
pd.merge(X_train, all_data[all_data_cols_new], left_index=True, right_index=True)
【讨论】: