【发布时间】:2020-10-28 16:42:28
【问题描述】:
我需要确定每个具有条件的集群的每列中值的百分比。可重现的示例如下。我有一张这样的桌子:
> tab
GI RT TR VR Cluster_number
1 1000086986 0.5814 0.5814 0.628 1
10 1000728257 0.5814 0.5814 0.628 1
13 1000074769 0.7879 0.7879 0.443 2
14 1000498642 0.7879 0.7879 0.443 2
22 1000074765 0.7941 0.3600 0.533 3
26 1000597385 0.7941 0.3600 0.533 3
31 1000502373 0.5000 0.5000 0.607 4
32 1000532631 0.6875 0.7059 0.607 4
33 1000597694 0.5000 0.5000 0.607 4
34 1000598724 0.5000 0.5000 0.607 4
我需要这样的表格:
> tab1
Cluster_number RT_cond TR_cond VR_cond
1 1 0 0 100
2 2 100 100 0
3 3 100 0 0
4 4 25 25 100
其中对应列中的值表示对应簇中 GI 的百分比,其中 RT >= 0.6、TR >= 0.6 和 VR >= 0.6。即在第一个簇中,所有的RT = 0.6,所以最终表中对应的值是 25。我该怎么做呢?
【问题讨论】:
标签: r dataframe dplyr tibble summarize