【发布时间】:2020-11-26 13:34:00
【问题描述】:
对于你们中的一些人来说,这可能是一个简单的练习。请参阅下面我正在使用的数据集:
d1t1 d1t2 d1t3 d1t4 d2t1 d2t2 d2t3 d2t4
1 1 1 2 1 1 1 2
2 2 0 5 1 2 0 2
1 2 0 7 1 2 1 2
1 1 0 7 1 2 1 2
变量的简短解释:
d1t1=Day 1 time 1
d1t2=Day 1 time 2
....
d2t1=Day2 time 1
d2t2=Day2 time 2
0,1,2,5,7 = 不同类型的测量
我想计算每天在完全相同的时刻花费在测量上的时间百分比。但我不知道如何将我的数据从宽到长格式化,但我不知道如何返回基于不同时间步长的测量百分比。
输出:
t1
d1: 1-75%; 2-25% # considering that during d1t1 4 people took measurements
d2: 1-100%;
t2
d1: 1-50%; 2-50%
d2: 1-50%; 2-50%
样本数据:
df<-structure(list(d1t1 = c(1, 2, 1, 1),
d1t2 = c(1, 2, 2, 1), d1t3 = c(1, 0, 0, 0), d1t4 = c(2, 5, 7, 7),
d2t1 = c(1, 1, 1, 1), d2t2 = c(1, 2, 2, 2), d2t3 = c(1, 0, 1 ,1), d2t4=c(2,2,2,2)), row.names = c(NA,
4L), class = "data.frame")
【问题讨论】:
-
你是怎么想出号码
1-75%; 2-25%等的?你能解释一下计算吗? -
@RonakShah 非常感谢我假设在 d1t1 期间有 4 人报告了测量结果。基于此,我计算出 4 人中 75% 的人报告了第 1 次测量,剩下的 25% 是 1 人报告第 2 次测量的结果。
-
@RonakShah 也许需要插入一个新变量来报告病例数?
标签: r dataframe percentage