【发布时间】:2015-06-24 05:18:31
【问题描述】:
我有一个包含多个标题的文件,我也需要这些标题。
我的文件头:
>\>1 Len = 254
>13 112 1 18
>15 112 1 30
>22 11 3 25
>\>1 Reverse Len = 254
>14 11 1 15
>\>2 Len = 186
>19 15 2 34
>25 11 3 25
>....
如何读取此文件,并将值导入 R 变量(如数据框)?
或者,如果有人可以帮助我们删除标题并添加代表表格数量的另一列(或显示该行是另一个表格的第一行),那就太好了
我不想把它读成字符串并解析它
如果有帮助,数据是来自 MUMMER 包的报告
我还在这里上传了一个示例: http://m.uploadedit.com/ba3c/1429271308686.txt
【问题讨论】:
-
通常的方法是使用
readLines加载文件,然后根据需要将每一行转换为字符或数字。稍微搜索一下,你会发现几个和你类似的问题。 -
您能否上传/链接到实际数据文件的缩短版本(.txt、.dat...),以便我们尝试一下?
-
基本上你必须编写自己的解析器,如果还没有人为这种文件格式写过。
-
“我不想将其读取为字符串并对其进行解析” ...欢迎来到数据科学/统计学中 80% 的时间/工作。
-
library(SOfun); read.mtable("http://m.uploadedit.com/ba3c/1429271308686.txt", ">")?但这本质上是将文件作为字符串读取并解析它。 Here's "SOfun".
标签: r input io read.table