【发布时间】:2017-11-11 21:21:26
【问题描述】:
我是 R 新手,需要一些帮助。我有一个包含不同患者样本的庞大数据框。每位患者有 24 个“铬”。每个“铬”有 3 个段。以下是患者“A2461”的示例。以下是我拥有的一些数据的示例:
ID chrom loc.start loc.end num.mark seg.mean seg.sd seg.median seg.mad
1 A2461 1 61735 23342732 13103 0.0314 0.4757 0.0221 0.4811
2 A2461 1 23345569 54962669 17435 -0.0103 0.4807 -0.0292 0.4821
3 A2461 1 54963958 55075062 57 0.4841 0.4070 0.5201 0.3519
1 A2461 2 12784 17248573 13037 -0.0037 0.4643 -0.0053 0.4583
2 A2461 2 17248890 85480817 45819 -0.0331 0.4667 -0.0352 0.4635
3 A2461 2 85481399 89121495 1626 0.0153 0.4727 0.0000 0.4617
我目前使用以下代码获得总平均值:
seg_mean <- df$seg.mean
mean(seg_mean)
但是,我想计算每个染色体的“seg.mean”的平均值,并输出阐明患者 ID 和色度的输出。所以也许像......
ID chrom seg.mean
A2461 1 0.1684
A2461 2 -0.0072
任何帮助将不胜感激!感谢阅读。
【问题讨论】:
-
This answer 可能会有所帮助。 Or this one.
-
aggregate(.~ID, data=df, mean)
标签: r dataframe dplyr bioinformatics mean