【发布时间】:2017-06-02 16:26:22
【问题描述】:
我观察到以下情况,使用我为计算每组的一系列总和而构建的一些脚本:
In [291]: sums_per_group2
Out[291]:
test_group control_group
one 4551.658544 4449.3
three 3770.712771 3430.5
two 9328.171538 8673.9
In [292]: sums_per_group2.shape
Out[292]: (3, 2)
In [293]: np.corrcoef(sums_per_group2)
Out[293]:
array([[ 1., 1., 1.],
[ 1., 1., 1.],
[ 1., 1., 1.]])
In [294]: np.corrcoef(sums_per_group2.values)
Out[294]:
array([[ 1., 1., 1.],
[ 1., 1., 1.],
[ 1., 1., 1.]])
In [295]: sums_per_group2.values.shape
Out[295]: (3, 2)
In [296]: np.corrcoef(sums_per_group2.iloc[:,0],sums_per_group2.iloc[:,1])
Out[296]:
array([[ 1. , 0.99853641],
[ 0.99853641, 1. ]])
In [296]: sums_per_group2.iloc[:,0].shape
Out[296]: (3,)
In [297]: sums_per_group2.iloc[:,1].shape
Out[297]: (3,)
如您所见,np.corrcoef() 的任何输入之间的形状都是严格精确的。
有人可以帮我理解一下吗?
【问题讨论】:
标签: python pandas numpy series