【发布时间】:2020-05-25 19:08:27
【问题描述】:
我正在使用 read.csv2 将数据读入 R 数据帧。使用我的一个数据集,以某种方式将一些变量放入下一行,创建额外的行并切割列。举例说明:
我的 CSV 看起来像这样:
var1,var2,var3
value1,value2,value3
value1,value2,value3
然而,数据框是这样的:
var1 var2
value1 value2
value3
value1 value2
value3
我在很多 CSV 文件上使用了相同的命令,即使是在一个具有完全相同文件的不同样本的文件上,但从未遇到过这个问题。有没有人知道是什么原因造成的?
【问题讨论】:
-
你能提供一个可重现的示例数据集吗?还有你想要的输出?
-
模式似乎不完整或错误。
var3没有出现在数据框中。 -
你的 csv 文件可能有问题,还有一些额外的
\n或类似的东西 -
我发现 excel 可以在 csv 文件行的末尾添加大量额外的 , (逗号),这可能会破坏其他试图读取数据的程序。我建议你用程序员文本编辑器检查你的 csv 文件。
-
@jyr,由于我仍然不确定如何在此处上传数据集,因此我附上了原始帖子中数据集的截图。拆分发生在超过 3 列的每一行中。
标签: r