【发布时间】:2015-10-24 21:27:59
【问题描述】:
我有一个非常规的 DataFrame(从 csv 读取)。它看起来像这样:
SubjAns a1 a2 demog
S1A1 "1,2,3" "4,6" A
S1A2 "101,1" NaN B
对于每个单元格,我首先需要将字符串转换为浮点数列表(熊猫有没有办法将其读取为浮点数列表而不是字符串?)然后我想创建一个新的由均值和标准差组成的DataFrame:
SubjAns a1_mean a1_stdev a2_mean a2_stdev demog
S1A1 3.0 1 5.0 1.41 A
S1A2 51.0 70.71 NaN NaN B
这可能吗?我最终会将它读入 scikit-learn,所以如果有任何方法更适合它,请包含它。
【问题讨论】:
标签: python csv pandas scikit-learn dataframe