【发布时间】:2017-11-22 20:45:45
【问题描述】:
我正在上我的第一个 R 课程。练习之一是创建一个包含 1000 个碱基的随机 DNA 字符串,并计算 GC 百分比 (GC%)。
我创建了DNA碱基向量并尝试创建序列,但是结果不正确
DNA <- c("A","G","T","C")
seq <- strrep(DNA, 250)
对这个菜鸟有什么建议吗?
【问题讨论】:
-
试试
sample(DNA, 1000, replace=TRUE),如果你真的需要它是一个单一的字符串,只需将它粘贴在一起:paste(sample(DNA, 1000, replace=TRUE), collapse="") -
您想要碱基百分比等于 G 还是 C,还是想要具有连续 GC 碱基的百分比?如果你想要后者做
library(stringr); chain <- paste(sample(DNA, 1000, replace = T), collapse=""); str_count(chain, "GC").