【发布时间】:2018-09-25 11:44:49
【问题描述】:
计算我的特征和目标变量之间相关性的最佳解决方案是什么?我的数据框有 1000 行和 40 000 列...
示例:
df = pd.DataFrame([[1, 2, 4 ,6], [1, 3, 4, 7], [4, 6, 8, 12], [5, 3, 2 ,10]], columns=['Feature1', 'Feature2','Feature3','Target'])
这段代码运行良好,但在我的数据帧上太长了……我只需要相关矩阵的最后一列:与目标相关(不是成对特征相关)。
corr_matrix=df.corr()
corr_matrix["Target"].sort_values(ascending=False)
np.corcoeff() 函数适用于数组,但我们可以排除成对特征相关性吗?
【问题讨论】:
-
为了更好的答案请看这里:datascience.stackexchange.com/questions/39137/…
标签: python numpy dataframe correlation