【发布时间】:2020-05-08 00:24:35
【问题描述】:
我正在尝试通过 txt 文件将庞大的数据集加载到 sklearn 系统中。或者有没有简单的上传方法
【问题讨论】:
-
这太宽泛/模糊了。
标签: python scikit-learn sklearn-pandas
我正在尝试通过 txt 文件将庞大的数据集加载到 sklearn 系统中。或者有没有简单的上传方法
【问题讨论】:
标签: python scikit-learn sklearn-pandas
你读它有什么问题? 作为一般建议,您可以分块阅读:
chunksize = 10000
for chunk in pd.read_csv(filename, chunksize=chunksize):
# do whatever you suppose to
根据您的 PC 配置正确指定 chunksize 参数。 您可以阅读this question 了解更多选项。
【讨论】: