【问题标题】:How to generate a random string and compute the percent of a specific string?如何生成随机字符串并计算特定字符串的百分比?
【发布时间】:2017-11-22 20:45:45
【问题描述】:

我正在上我的第一个 R 课程。练习之一是创建一个包含 1000 个碱基的随机 DNA 字符串,并计算 GC 百分比 (GC%)。

我创建了DNA碱基向量并尝试创建序列,但是结果不正确

DNA <- c("A","G","T","C")
seq <- strrep(DNA, 250)

对这个菜鸟有什么建议吗?

【问题讨论】:

  • 试试sample(DNA, 1000, replace=TRUE),如果你真的需要它是一个单一的字符串,只需将它粘贴在一起:paste(sample(DNA, 1000, replace=TRUE), collapse="")
  • 您想要碱基百分比等于 G 还是 C,还是想要具有连续 GC 碱基的百分比?如果你想要后者做library(stringr); chain &lt;- paste(sample(DNA, 1000, replace = T), collapse=""); str_count(chain, "GC").

标签: r string random


【解决方案1】:

基本上你应该查看R 的基本知识,即sumsamplepaste 函数。解决方法很简单:

DNA <- c("A","G","T","C")
chain <- sample(DNA, 1000, replace = T)
GCcontent <- sum(chain %in% c('G','C'))/length(chain)
# chain as a string
paste(chain, collapse="")

【讨论】:

    猜你喜欢
    • 2014-02-09
    • 2023-03-22
    • 2017-03-24
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多