【发布时间】:2020-07-31 12:36:16
【问题描述】:
我正在处理相当大的数据集(每月大约 4 mio 行,具有 25 个数字属性和 4 个因子属性)。我想创建一个图表,其中包含每个月(过去 36 个月)每个产品的每个数字属性(4 个因素属性之一)的箱线图。
以产品 A 为例:
-
_ | -
_|_ | _|_
| | | | |
| | _|_ | |
| | | | |---|
| | |---| | |
|---| | | | |
|_ _| | | |_ _|
| |_ _| |
| | |
- | -
-
--------------------------------------------------------------
jan '10 feb '10 mar '10 ................... feb '13
但由于这些数据集非常大,我将使用这些数据集,因此我想获得一些建议,以开始如何处理。我的想法(但我不确定这是否可能)是
- a) 每个产品每月提取数据
- b) 为特定月份创建箱线图(假设产品 A 为 10 年 1 月)
- c) 将箱线图汇总数据存储在某处
- d) 在所有月份重复 a-c,直到 2013 年 2 月
- e) 将所有存储的箱线图汇总数据合二为一
- f) 绘制组合箱线图 g) 对所有其他产品重复 a-f
所以我的主要问题是:是否可以将单独的 boxlot 汇总合并为一个,并根据上面的草图创建组合图?
任何帮助将不胜感激,
谢谢
【问题讨论】:
-
要开始使用,您可以先执行
result <- boxplot(1:10,plot=FALSE)和bxp(result)之类的操作,请参阅?boxplot和?bxp
标签: r statistics boxplot