【发布时间】:2025-12-07 10:00:01
【问题描述】:
我有许多 csv 文件,其中包含多行和多列,其中大部分是浮点数(有些是分类的,但单热编码)。 每个 csv 文件是一个训练示例的表示。它在同一个文件中包含因变量和自变量。 (例如,它不像机器学习问题,每行包含所有信息并预测该行的 y1、y2、y3,它像 x1 到 x8 的所有行组合 将预测 y1 到 y3 的所有行组合。因此,每个 csv 都成为一个训练样本。
representation of one such csv
** 上图是此类 csv 文件之一的表示
请注意,每个 csv 的长度/大小各不相同。
我想构建一个简单的 ann 或任何其他神经网络模型。我在处理输入数据时遇到问题。由于每个 csv 都是一个单独的训练示例,我应该以哪种格式存储数据以传递给神经网络。
提前致谢, skw
【问题讨论】:
-
数据是关于什么的?行或列是否以任何方式相关。请提供更多信息。你得到 3 个输出:
y1,y2,y38 个输入属性:x1-x8
标签: python-3.x csv machine-learning