【发布时间】:2021-08-18 20:11:50
【问题描述】:
我有2个数据帧df1和df2,df1如下代码所示,df2是每组每一列的填充平均值,也如下代码所示
import pandas as pd
import numpy as np
data = {'Group':['1', '1', '2', '2'],
'A':[1, 5, 15, 170],
'B':[7, 12, 100.1, 14],
'C':[2, 3.1, 6, 1],
}
df1 = pd.DataFrame(data)
df2 = df1.groupby("Group").transform(lambda x: x.mean())
我想计算 R 平方的值,循环遍历 2 个数据帧并计算每对列的 r 平方 df1['A'] & df2['A'] , df1['B'] & df2 ['B'], .... 预期结果是一个数据框,其中填充了 A&A 、 B&B ... 列的 Rsquared 值。 谢谢!
【问题讨论】:
-
你能在你的问题中写出预期的结果是什么吗?
-
@BeChillerToo Done
-
我相信@BeChillerToo 的意思是您期望 A 和 A 的 Rsquared 值的 值。多少个值,以什么形式,等等。
-
@HenryEcker 在这种情况下会有 3 个值, df1['A'] & df2['A'] 的 Rsquared , df1['B'] & df2['B'] & df1 ['C'] & df2['C'] ,但由两个表中的列循环产生
-
好的,那三个值是什么? (数值)
标签: python pandas dataframe scikit-learn