【发布时间】:2021-02-23 14:55:48
【问题描述】:
假设我们有以下数据集(长度为 24):
x <- c(30L, 49L, 105L, 115L, 118L, 148L, 178L, 185L, 196L, 210L, 236L, 236L,
278L, 287L, 329L, 362L, 366L, 399L, 430L, 434L, 451L, 451L, 477L, 488L, 508L,
531L, 533L, 542L)
如果我们计算五数摘要: 最小值为 30,最大值:542,中值:(287 + 329) /2 = 308...这是最简单的部分!
- Q1 是子集 [30, 49,105,....287] 的中位数,长度为 14 --> Q1 = [178 + 185]/2 = 181.5
- Q3 " " " " [329,362,...,542] = [451 + 451] / 2 = 451
现在,如果我们使用函数 summary(dataset) 进行检查...我们得到:
Min. 1st Qu. Median Mean 3rd Qu. Max.
30.0 183.2 308.0 309.7 451.0 542.0
为什么我们会得到不同的 Q1?函数summary如何计算Q1?
【问题讨论】:
标签: r statistics stochastic