【问题标题】:How can I load CSV data for a PyTorch neural network?如何为 PyTorch 神经网络加载 CSV 数据?
【发布时间】:2020-05-08 00:46:21
【问题描述】:

这可能是一个简单的问题,如果太简单了,我深表歉意。但我在 CSV 中有一些数据:

Date,Open,High,Low,Close,Adj Close,Volume
1993-01-29,43.968750,43.968750,43.750000,43.937500,26.453930,1003200
1993-02-01,43.968750,44.250000,43.968750,44.250000,26.642057,480500
1993-02-02,44.218750,44.375000,44.125000,44.343750,26.698507,201300
1993-02-03,44.406250,44.843750,44.375000,44.812500,26.980742,529400
1993-02-04,44.968750,45.093750,44.468750,45.000000,27.093624,531500
1993-02-05,44.968750,45.062500,44.718750,44.968750,27.074818,492100
1993-02-08,44.968750,45.125000,44.906250,44.968750,27.074818,596100
1993-02-09,44.812500,44.812500,44.562500,44.656250,26.886669,122100
....

我想创建一个“训练集”,它基本上是从文件中的任何位置随机采样的 10 行数据(我可以计算出标准化等)的随机向量。我想我可能不得不使用pandas 来进行加载?

如果我想问的问题不清楚,请添加 cmets,我会相应地调整问题。谢谢。

【问题讨论】:

标签: python pandas numpy pytorch


【解决方案1】:
import pandas as pd

sample = pd.read_csv('myfile.csv').sample(n=10)

您应该只加载文件 1 次,然后在进行时采样:

df = pd.read_csv('myfile.csv')
sample1 = df.sample(n=10)
sample2 = df.sample(n=10)

【讨论】:

  • 这个样本会连续行吗?
  • @Shamoon 不,这是随机的,请参阅文档以获取更多详细信息pandas.dataframe.sample()
【解决方案2】:

要读取csv,需要导入pandas。

使用此代码

import pandas as pd
data = pd.read_csv("filename.csv")

将filename.csv 放在引号中。 如果您的文件位于不同的文件夹中,请使用引号中的完整路径 "C:/Users/user/Desktop/folder/file.csv"

【讨论】:

  • 要读取 csv,你需要导入 pandas。 假设你的意思是“为了读取 CSV 文件,你需要使用 Pandas”,那是完全错误的。
猜你喜欢
  • 2021-07-05
  • 2019-05-16
  • 1970-01-01
  • 2018-12-16
  • 2015-10-03
  • 2021-03-11
  • 2019-03-08
  • 2021-06-21
  • 1970-01-01
相关资源
最近更新 更多