【发布时间】:2020-09-18 15:01:20
【问题描述】:
如标题所示,我有一个名为 df 的数据框。
给定一个变量(df 的指定列),我想找到与该变量相关值最高的列。
到目前为止,这是我尝试过的:
def highest_correlated(df, column):
sol = -1
for col in df.columns:
while col != column:
corr = df[column].corr(df[col])
if corr>sol:
sol = corr
return sol
这样做的问题是花费了太多时间,最后我没有得到任何结果,任何人都可以帮我找到解决方案吗?
【问题讨论】:
标签: python pandas correlation