【发布时间】:2013-10-08 14:07:47
【问题描述】:
我是一名生物学家,对编程知之甚少。我有一系列文件(fasta 格式文件),我需要为其应用 R 包。
每个文件内容如下:
FILE_1.FASTA
>>TTBK2_Hsap ,(CK1/TTBK)
MSGGGEQLDILSVGILVKERWKVLRKIGGGGFGEIYDALDMLTRENVALKVESAQQPKQVLKMEVAVLKKLQGKDHVCRFIGCGRNDRFNYVVMQLQGRNLADLRRSQSRGTFT
FILE_2.FASTA
>>TTBK2_Hsap ,(CK1/TTBK)
MSGGGEQLDILSVGILVKERWKVLRKIGGGGFGEIYDALDMLTRENVALKVESAQQPKQVLKMEVAVLKKLQGKDHVCRFIGCGRNDRFNYVVMQLQGRNLADLRRSQSRGTFT
包(R 中的 protr)的工作方式如下:
x = readFASTA(system.file(’protseq/P00750.fasta’, package = ’protr’))[[1]]
extractAAC(x)
有没有可能为上面的行设置一个forloop来读取多个文件并在一个文件中给出输出??
如果可能,请给我一些想法或任何可以帮助我在 R 中设置 for 循环的示例。
【问题讨论】:
-
您可能想要
lapply(dir(pattern='.fasta'), readFASTA)之类的东西,但我对这个包不熟悉,所以您可能需要修改代码才能使其工作。
标签: r bioinformatics