【发布时间】:2020-02-29 16:42:39
【问题描述】:
我有一个数据集,其中有两个变量让我感兴趣:trial 和 truth。试验数字人们被问到的问题(总共 20 个)。真理代表每个问题的正确答案。我想计算每个问题的真相log10()。我想出了这个:
logT <- data %>%
group_by(trial) %>%
unique(truth, incomparables = F) %>%
summarize(log10(truth))
我不确定使用unique() 是否是最好的主意,但是在较小的dataframe 中,该语法对我有用。
trial truth
1 1 34
2 1 34
3 2 321
4 2 321
5 3 78
6 3 78
但是对于原始数据,它会不断重复所有行,尽管它们完全相同。所以我最终得到了1600个obs。而不是我的目标是 20 个。
在运行参数之前,我使用select() 仅使用相关变量,但它仍然不起作用。
我哪里出错了,或者有没有更好的从头开始的方法?
【问题讨论】:
-
truth的值是日志吗?
标签: dataframe r dplyr data-manipulation