【发布时间】:2021-08-16 02:29:52
【问题描述】:
不确定为什么 R 不能正确计算我的数据的平均值。我确实有很多 NA 值,但 R 一直告诉我平均值是 NA。这是一个例子:
data1=read_excel"pepper.xlsx"
data1$cultivar = as.factor(data1$cultivar)
mean = aggregate(data1[,3:4], list(data1$cultivar), mean)
| cultivar | replication | width | height |
|---|---|---|---|
| BOF | 1 | 12 | 14 |
| BOF | 2 | 10 | NA |
| BOF | 3 | NA | 15 |
| BOF | 4 | NA | NA |
它不是计算 BOF 的平均宽度为 11 和平均 height 为 14.5,而是计算高度和宽度的平均值为 NA。这是对我的数据的过度简化。我的研究中有几个品种,并使用aggregate 函数计算了每个品种的每个变量的平均值。
【问题讨论】:
-
mean有一个参数na.rm来删除缺失值。添加na.rm = TRUE作为参数。详情请见?mean。 -
另外,请注意您的措辞 - “R 不会正确计算意味着”听起来好像您认为 R 中存在错误。“我如何忽略
mean中的缺失值”是更政治化的方式来表达这个问题。 -
aggregate(.~cultivar, data1, mean, na.rm = TRUE) -
@GregorThomas 谢谢!这解决了我的问题。对措辞感到抱歉,但感谢您的提醒。我以前从未编码过,我希望自学 R 来分析我的研究生课程的数据。希望如果我不小心说错了话或做错了事,我不会受到这个社区的强烈反对。只是来这里学习!