【发布时间】:2014-06-18 21:16:55
【问题描述】:
以下是 myfile.csv 中的内容
1st 2nd 3rd 4th 5th
2061100 10638650 -8000 25 [1.0, 1.0, 1.0, 1.0, 1.0, 1.0, 1.0]
2061800 10639100 -8100 26 [2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0]
2061150 10638750 -8250 25 [3.0, 3.0, 3.0, 3.0, 3.0, 3.0, 3.0]
2061650 10639150 -8200 25 [4.0, 4.0, 4.0, 4.0, 4.0, 4.0, 4.0]
2061350 10638800 -8250 3 [5.0, 5.0, 5.0]
2060950 10638700 -8000 1 [1.0]
2061700 10639100 -8100 11 [2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0, 2.0]
2061050 10638800 -8250 6 [3.0, 3.0, 3.0, 3.0, 3.0, 3.0]
2061500 10639150 -8200 1 [4.0]
2061250 10638850 -8150 16 [5.0, 5.0, 5.0, 5.0]
我的代码:
from numpy import genfromtxt
mydata = genfromtxt('myfile.csv', delimiter=',')
arr = np.array(mydata)
col5 = arr[:,4]
我想从 csv 文件中读取第 5 列。但是,第 5 列中的元素是列表而不是值。
如何修改我的代码?
【问题讨论】:
-
你称它为 CSV 文件,我看不到逗号分隔符。实际的分隔符是什么?
-
您想将第 5 列作为列表读取还是要为列表中的每个值创建一列?
-
查看
csvmodule for python。然后是这个:stackoverflow.com/questions/20363395/…. -
@DavidK 我想将第 5 列作为列表读取,然后从列表中读取所有元素并进行计算
-
@merlin2011:“CSV 文件”已成为任何固定宽度格式 (FWF) 的通用名称,无论它是否具有显式分隔符。