【发布时间】:2020-10-12 20:26:04
【问题描述】:
我正在使用“d.pizza”数据。有一个名为“delivery_min”的变量是交货时间(以分钟为单位),还有一个名为“area”的变量可以是三个区域之一(卡姆登、威斯敏斯特和布伦特)。 我想绘制一个密度图,以可视化这三个区域的交货时间分布。
我试过了
plot.ecdf(pizza_d$delivery_min)
此代码有效,但如何针对每个区域执行此操作?
head(d.pizza)=
index date week weekday area count rabate price operator driver delivery_min
1 1 1 01.03.2014 9 6 Camden 5 TRUE 65.655 Rhonda Taylor 20.0
2 2 2 01.03.2014 9 6 Westminster 2 FALSE 26.980 Rhonda Butcher 19.6
3 3 3 01.03.2014 9 6 Westminster 3 FALSE 40.970 Allanah Butcher 17.8
4 4 4 01.03.2014 9 6 Brent 2 FALSE 25.980 Allanah Taylor 37.3
5 5 5 01.03.2014 9 6 Brent 5 TRUE 57.555 Rhonda Carter 21.8
6 6 6 01.03.2014 9 6 Camden 1 FALSE 13.990 Allanah Taylor 48.7
temperature wine_ordered wine_delivered wrongpizza quality
1 53.0 0 0 FALSE medium
2 56.4 0 0 FALSE high
3 36.5 0 0 FALSE <NA>
4 NA 0 0 FALSE <NA>
5 50.0 0 0 FALSE medium
6 27.0 0 0 FALSE low
【问题讨论】:
-
您好,请查看how to make a reproducible example。了解数据集的名称和列是有帮助的,但为了提供完整的答案,我们需要的不仅仅是这些。目前我能做的最好的事情是建议您按您的区域
filter您的数据集并单独绘制它们 -
@Punintended,我不知道如何过滤我的数据以仅提供“布伦特”地区的交货时间(例如)
标签: r density-plot ecdf