【发布时间】:2021-09-08 12:24:23
【问题描述】:
我有一个correlation matrix,它是一个pandas 数据框,如下所示:
import pandas as pd
foo = pd.DataFrame({'vars': ['col_a', 'col_b', 'col_c', 'col_d'],
'col_a': [1, 0.9, 0.04, 0.03],
'col_b': [0.9,1,0.05,0.03],
'col_c': [0.04, 0.05, 1, -0.04],
'col_d': [0.03, 0.03, -0.04,1]})
我想获得所有唯一“对”,其绝对值具有高于某个threshold 的相关性并排除自相关
所以,如果阈值是0.8,我应该得到这样的东西:
[('col_a', 'col_b')]
有什么想法可以做到吗?
【问题讨论】:
-
你想拥有独一无二的对吗?和自相关?
-
是否可能改变预期输出?因为接受的解决方案不匹配。
-
好的,然后超级。编码愉快。
-
是的,我现在看到你的编辑了 :)
-
已删除解决方案,最好以后不要更改问题,因为答案不匹配。如果像这里一样快速变化,最好发布新问题。
标签: python python-3.x pandas