【发布时间】:2016-02-26 14:46:04
【问题描述】:
我有一个下面列出的数据框,其中按日期列出了多个条目。我想按项目计算每天的平均收入。输出需要在数据框中,因为我想在 ggplot 中使用它。 无论我做什么,我都会得到与日期有关的数据框所有行中相同的数据。
dataframe:
quantity pricereal tip length name date average
2 2 12.66 Typ-3 2m Typ-3 2m 2015-08-03 8.351814
3 1 6.87 Typ-3 2m Typ-3 2m 2015-08-03 8.351814
7 1 10.62 Typ-6 2m Typ-6 2m 2015-08-03 8.351814
49 1 12.61 Typ-4 2m Typ-4 2m 2015-08-04 8.351814
50 4 10.62 Typ-6 2m Typ-6 2m 2015-08-04 8.351814
61 2 9.14 Typ-1 2m Typ-1 2m 2015-08-05 8.351814
62 3 4.41 Typ-1 2m Typ-1 2m 2015-08-05 8.351814
我得出的平均值显然是错误的。我写了以下语法:
data_alu$average <- NA
data_alu$average <- mean(data_alu$pricereal)
我认为解决方案是使用 tapply 但我收到一条错误消息,因为有更多行对应一个日期。
data_alu$average <-tapply(data_alu$date, data_alu$pricereal, mean)
只是为了澄清我想要每天的平均值..不是所有数据的平均值
希望外面有救世主……
【问题讨论】:
-
你能输入你的数据吗
-
查看
ave()函数