【发布时间】:2018-05-09 03:24:46
【问题描述】:
我有一个 DataFrame,其中一列是数组列表。
import pandas as pd
v = [1, 2, 3, 4, 5, 6, 7]
v1 = [1, 0, 0, 0, 0, 0, 0]
v2 = [0, 1, 0, 0, 1, 0, 0]
v3 = [1, 1, 0, 0, 0, 0, 1]
df = pd.DataFrame({'A': [v1, v2, v3]})
print df
输出:
A
0 [1, 0, 0, 0, 0, 0, 0]
1 [0, 1, 0, 0, 1, 0, 0]
2 [1, 1, 0, 0, 0, 0, 1]
我想针对单个向量 v 为 df.A 的每一行做一个 pd.Series.corr。 我目前正在 df.A 上循环并实现它。速度很慢。
预期输出:
A B
0 [1, 0, 0, 0, 0, 0, 0] -0.612372
1 [0, 1, 0, 0, 1, 0, 0] -0.158114
2 [1, 1, 0, 0, 0, 0, 1] -0.288675
【问题讨论】:
标签: performance pandas numpy dataframe