如何为 PyTorch 神经网络加载 CSV 数据？答案

【问题标题】：How can I load CSV data for a PyTorch neural network?如何为 PyTorch 神经网络加载 CSV 数据？
【发布时间】：2020-05-08 00:46:21
【问题描述】：

这可能是一个简单的问题，如果太简单了，我深表歉意。但我在 CSV 中有一些数据：

Date,Open,High,Low,Close,Adj Close,Volume
1993-01-29,43.968750,43.968750,43.750000,43.937500,26.453930,1003200
1993-02-01,43.968750,44.250000,43.968750,44.250000,26.642057,480500
1993-02-02,44.218750,44.375000,44.125000,44.343750,26.698507,201300
1993-02-03,44.406250,44.843750,44.375000,44.812500,26.980742,529400
1993-02-04,44.968750,45.093750,44.468750,45.000000,27.093624,531500
1993-02-05,44.968750,45.062500,44.718750,44.968750,27.074818,492100
1993-02-08,44.968750,45.125000,44.906250,44.968750,27.074818,596100
1993-02-09,44.812500,44.812500,44.562500,44.656250,26.886669,122100
....

我想创建一个“训练集”，它基本上是从文件中的任何位置随机采样的 10 行数据（我可以计算出标准化等）的随机向量。我想我可能不得不使用pandas 来进行加载？

如果我想问的问题不清楚，请添加 cmets，我会相应地调整问题。谢谢。

【问题讨论】：

到底是什么问题？你有没有尝试过，做过任何研究？就目前而言，这只是 stackoverflow.com/q/41585078/11301900 的副本。

标签： python pandas numpy pytorch

【解决方案1】：

import pandas as pd

sample = pd.read_csv('myfile.csv').sample(n=10)

您应该只加载文件 1 次，然后在进行时采样：

df = pd.read_csv('myfile.csv')
sample1 = df.sample(n=10)
sample2 = df.sample(n=10)

【讨论】：

这个样本会连续行吗？
@Shamoon 不，这是随机的，请参阅文档以获取更多详细信息pandas.dataframe.sample()

【解决方案2】：

要读取csv，需要导入pandas。

使用此代码

import pandas as pd
data = pd.read_csv("filename.csv")

将filename.csv 放在引号中。如果您的文件位于不同的文件夹中，请使用引号中的完整路径 "C:/Users/user/Desktop/folder/file.csv"

【讨论】：

要读取 csv，你需要导入 pandas。 假设你的意思是“为了读取 CSV 文件，你需要使用 Pandas”，那是完全错误的。