【发布时间】:2018-05-21 21:14:39
【问题描述】:
我无法弄清楚如何使用多个分隔符导入我的数据。以下是我的电脑自动保存到文本文件中的内容。问题是某些结果是用不同间距的分隔符打印的。一些分隔符是冒号 (:),而另一些则是长度不一致的多个空格。
每个字母 (B: 到 Z:) 编码一些唯一变量。例如:
B:响应数
C:秒数等
但是,“Z:0.000”下方的信息,即布局发生变化的地方,是变量获取子集的时间。所以,
答:
0: value1 value2 value3 value4
被引用为:
A(0) = value1(例如第一次试验中的响应数)
A(1) = value2(例如第二次试验中的响应数)
A(2) = value3(例如第三次试验中的响应数)
A(3) = value4(例如第四次试验中的响应数)
这里有 4 个“A”变量,每个变量也可以携带唯一值。
文本文件示例:
Start Date: 05/20/18
End Date: 05/20/18
Subject: 1
Start Time: 16:23:11
End Time: 17:26:24
B: 7.000
C: 12000.000
D: 9500.000
E: 1.000
Q: 203.000
T: 1200.100
U: 218.000
W: 7.000
X: 347.000
Y: 0.000
Z: 0.000
A:
0: 1.000 0.000 0.000 0.000
F:
0: 11500.000 9500.000 13500.000 7500.000 15500.000
5: 5500.000 17500.000
我尝试了几种方法,但由于多个分隔符问题,它们被卡住了。假设“数据”是文本文件。
# This is the closest - some of the values are still not separated properly
temp <- read.delim2(file = "data", quote = ":", sep = "",)
# This one separate the information mostly correctly for the top half only
temp <- read.delim2(file = "data", sep = ":")
我最终想要一个数据框,其中一列(StartDate、A(0)、B 等)带有标签,另一列带有标签(05/20/2018, 1, 7)。
【问题讨论】:
-
示例中的空格和换行符实际上是否在您要解析的文本文件中?这是一个有用的示例,可以很容易地查看格式,但是您能否也粘贴几行原始文本文件,我们可以用来测试处理数据的方法?
-
该示例是在我的文本文件中找到的实际格式(所以是的 - 空格和换行符的显示与文件中的完全相同)。文件的下半部分似乎将其组织在与每列右侧对齐的列中。
标签: r