【发布时间】:2021-06-20 15:29:50
【问题描述】:
我有一个看起来像这样的数据框(18,000 行)。每行都有一个 p 值和一个附加的“频率”。频率是一个从 0 到 31 的因子。
> head(df)
Gene P.value Frequency
3 ENSG00000000419 1.000 1
9 ENSG00000001084 0.851 2
12 ENSG00000001461 0.699 4
26 ENSG00000002746 0.113 23
28 ENSG00000002834 0.529 12
33 ENSG00000003137 0.464 31
如何创建一个新的数据框来计算每个频率的 P.values 的比例,即小于 0.01?
我希望结果如下所示:
> head(result_Df)
Frequency Proportion
0 0.02
1 0.3
2 0.02
3 0.15
我认为 dplyr 可以很快地做到这一点,但我没有使用该软件包的经验。任何帮助表示赞赏!
【问题讨论】:
标签: r dplyr tidyverse data-wrangling