【发布时间】:2019-03-23 23:03:35
【问题描述】:
我有一个小时列表,我想计算平均值。该列表如下所示:
mydata
dawn dusk
1 7:12 19:14
2 7:10 19:15
3 7:09 19:16
4 7:07 19:17
5 7:06 19:18
6 7:04 19:19
7 7:02 19:20
8 7:01 19:21
我在 R 中尝试过,但找不到计算平均值的方法,因为对象不是数字或逻辑的。我可以这样计算平均值
mean(as.numeric(mydata$dusk)
但我无法理解结果 (57.5)。 我在 Excel 中尝试过,但它不起作用。如果我尝试像这样的小样本(mydata)正在工作,但数据集有 500 行并且 Excel 显示一个奇怪的结果(例如:在黎明时间列表中,所有或多或少都包含在 05:00 AM 和 08 :00 AM,结果是 18:30。黄昏时间同样的问题)。我不知道 Excel 问题是否取决于时区,所以我想在 R 中解决。 有什么建议吗? 问候, 丽莎
【问题讨论】:
-
你能粘贴输出
str(mydata) -
嗨,桑尼,当然。这是(完整数据集的)> str(mydata)'data.frame':501 obs。 2 个变量:$ 黎明:因子 w/185 水平“”,“5:02”,“5:03”,..:131 129 128 126 125 123 121 120 118 117 ... $ 黄昏:因子 w/179级别 "","18:22","18:23",..: 54 55 56 57 58 59 60 61 62 63 ...
-
在 Excel 中,您的数据或您使用的公式有些奇怪。使用 Excel 时间列,使用
AVERAGE函数计算平均值没有问题。因此,您的时间可能不是您认为的那样,或者您使用了不正确的公式来计算平均值。