【发布时间】:2021-11-13 02:04:23
【问题描述】:
当我使用pandas.DataFrame.corr() 创建相关矩阵时,我发现相关矩阵(corr_matrix)有 37 列,而 DataFrame(all_data)有 80 列。在我看来,这两列应该是一样的。换句话说,相关矩阵应该具有 (80 x 80) 的形状。但这并没有发生。在创建相关矩阵之前,我已经估算了所有缺失的数据。那么为什么两列不相等呢?
代码
corr_matrix = all_data.corr(method="kendall").abs()
print("Missing value descending:\n{}\n".format(all_data.isnull().sum().sort_values(ascending=False)[:5]))
print("Original Dataframe shape: {}".format(all_data.shape))
print("Correlation Matrix shape: {}".format(corr_matrix.shape))
输出
缺失值降序:
MSSubClass 0
MSZoning 0
车库YrBlt 0
车库类型 0
壁炉曲0
数据类型:int64
原始数据框形状:(2904, 80)
相关矩阵形状:(37, 37)
【问题讨论】:
-
您是否可能有同名的列?
-
@CeliusStingher 非常感谢。但没有一列具有相同的名称。
标签: python pandas correlation