【发布时间】:2011-05-31 10:31:05
【问题描述】:
R 专家,
我有一个大文本文件,它有特定的模式和格式。
我的 text.txt 包含
x1 `xx`nkkna`yy`taktnaknvcaklrhkahnktn, altlkhakthakd`xx`nmm cataitha`yy`knkcnaktnhakt
x2 `xx`ngkna`yy`taktnaknvcaklrhkahnktn, altlkhakthakdnmm cataithaknkcnaktnhakt
x3 `xx`nkg,kna`yy`taktnaknvcaklrhkahnktn, altlkhakthakdnmm cataithaknk`xx`cna`yy`ktnhakt
x4 nkkndataktnaknvcaklrhkahnktn, altlkhakthakdnmm cataithaknkcnaktnhakt
然后,我要让 R 找到一个单词列表,在这个例子中是 x1、x2、x3 和 x4 在这两者之间,我想为每个人获取一个列表,即在“xx”和“yy”之间。
因此,结果将是四个列表
x1 = c("nkkna", "nmm cataitha")
x2 = c("ngkna")
x3 = c("nkg,kna", "cna")
x4 = c("NA")
但是,我面临两个问题想请你帮忙。
- 如何将大文本文件读入 R?我从 stackoverflow 中了解到该命令
x
- 如何编写代码来获取所有这些信息?
我学习了strsplit 可能会用到,它似乎在RCurl报废材料中有效,在这里也有效吗?如果是的话,你能教我怎么做吗?
非常感谢......
【问题讨论】:
-
对于第一部分,这个问题有一些很好的信息:stackoverflow.com/questions/1727772/…
标签: list r text-files