【发布时间】:2019-12-13 17:48:41
【问题描述】:
我正在读取一个带有数值的文件。
data = pd.read_csv('data.dat', sep=' ', header=None)
在文本文件中,每一行都以空格结尾,因此 pandas 等待一个不存在的值,并在每一行的末尾添加一个“nan”。 例如:
2.343 4.234
读作: [2.343, 4.234, 南]
我可以使用, usecols = [0 1] 避免它,但我更喜欢更通用的解决方案
【问题讨论】:
-
你为什么不清理你的 csv?如果您的格式不规则,您只能期待这么多。
-
我同意@juanpa.arrivillaga 的观点,清理 CSV 比让你的程序处理所有这些不同的事情要好得多。出于好奇,您的数据是什么样的,您将其用于什么目的?
-
它们是神经网络模拟输出。一行有时间,另一行有神经元索引。既然你提到我可以在 C++ 中更改我的代码以避免多余的空间。