【发布时间】:2019-09-16 12:20:14
【问题描述】:
修改:
如果我有一个包含 5 列 Col1 & Col2 & Col3 & Col4 & Col5 的 pandas DataFrame,我需要获得最大 Pearson 相关系数介于 (Col2,Col3 ) & (Col2,Col4) & (Col2,Col5) 通过考虑Col1中的值
Col2的修改值由下式得到:
df['Col1']=np.power((df['Col1']),B)
df['Col2']=df['Col2']*df['Col1']
其中B 是变化变量(单个值),以获得最大 Pearson 相关系数(Col2,Col3)和(Col2,Col4 的新值)和( Col2,Col5) 的新值。
更新:
上表包含我上面提到的5列,说明了(Col2,Col3) & (Col2,Col4) & (Col2,Col5)之间的系数之间的相关性桌子下方。
我需要根据上面提到的两个等式更改Col2 的值,其中更改值为B。
所以问题是如何获得B 的最佳值,它给出的新相关系数大于或等于其对应物(旧)?
更新 2:
Col1,Col2,Col3,Col4,Col5
2,0.051361397,2618,1453,1099
4,0.053507779,306,153,150
2,0.041236151,39,54,34
6,0.094526419,2755,2209,1947
4,0.079773397,2313,1261,1022
4,0.083891415,3528,2502,2029
6,0.090737243,3594,2781,2508
2,0.069552772,370,234,246
2,0.052401789,690,402,280
2,0.039930675,1218,846,631
4,0.065952096,1706,523,453
2,0.053064126,314,197,123
6,0.076847486,4019,1675,1452
2,0.044881545,604,402,356
2,0.073102611,2214,1263,1050
0,0.046998526,938,648,572
【问题讨论】:
-
您能提供一个最小的示例数据框吗?
-
@Cleb 你能检查更新吗?
-
你能添加一个可以复制和粘贴的数据吗?图片没有多大帮助...
-
@Cleb 这可以吗?
-
是的,有兴趣的可以使用
df = pd.read_clipboard(sep=',')。
标签: python scipy correlation minimization scipy-optimize