如何生成随机字符串并计算特定字符串的百分比？答案

【问题标题】：How to generate a random string and compute the percent of a specific string?如何生成随机字符串并计算特定字符串的百分比？
【发布时间】：2017-11-22 20:45:45
【问题描述】：

我正在上我的第一个 R 课程。练习之一是创建一个包含 1000 个碱基的随机 DNA 字符串，并计算 GC 百分比 (GC%)。

我创建了DNA碱基向量并尝试创建序列，但是结果不正确

DNA <- c("A","G","T","C")
seq <- strrep(DNA, 250)

对这个菜鸟有什么建议吗？

【问题讨论】：

试试sample(DNA, 1000, replace=TRUE)，如果你真的需要它是一个单一的字符串，只需将它粘贴在一起：paste(sample(DNA, 1000, replace=TRUE), collapse="")
您想要碱基百分比等于 G 还是 C，还是想要具有连续 GC 碱基的百分比？如果你想要后者做library(stringr); chain <- paste(sample(DNA, 1000, replace = T), collapse=""); str_count(chain, "GC").

标签： r string random

【解决方案1】：

基本上你应该查看R 的基本知识，即sum、sample、paste 函数。解决方法很简单：

DNA <- c("A","G","T","C")
chain <- sample(DNA, 1000, replace = T)
GCcontent <- sum(chain %in% c('G','C'))/length(chain)
# chain as a string
paste(chain, collapse="")

【讨论】：