【发布时间】:2012-06-24 13:19:28
【问题描述】:
我目前尝试使用 Python 导入大型 csv 数据集未成功。基本上,我有一个由股票报价组成的大 csv 文件(一列股票,每只股票的另一列包含股息)。我正在使用 csv 模块,但事实是我无法得到一个 np.array 哪些列是股票报价。Python 按行创建一个 np.array,我想要一个按列的 np.array。我该怎么办??
谢谢你的帮助!!
【问题讨论】:
-
Python 的
csv模块使用生成器来迭代数据。如果你试图在一个 numpy 数组中存储一个巨大的数据集并且失败了,你可能根本没有足够的 RAM。 -
您的数据是什么样的?你尝试了什么?它是如何失败的?
-
您可以按行创建 numpy 数组,然后将其转置 (
myarray = myarray.T),或者,如果您使用np.array(columns)初始化数组,则可以将其更改为np.array(zip(*columns))。 -
如果您使用小型 csv 数据集,它会读取吗?如果是,你应该考虑大卫评论
标签: python csv time-series financial spyder