【发布时间】:2019-01-08 18:22:01
【问题描述】:
我有一个数据框,其中包含按卖家、年份和月份划分的销售计数,称为sales_by_month:
library(tidyverse)
sales_by_month <- tribble(
~Seller, ~Year, ~Month, ~Sales,
"John Doe", 2018, 1, 82,
"John Doe", 2018, 2, 72,
"John Doe", 2018, 3, 42,
"Sally Jane", 2018, 1, 25,
"Sally Jane", 2018, 2, 77)
我只需要按销售额随时间增长的卖家对这个数据集进行子集化,但我不知道该怎么做。
生成的子集数据集应包含;
Seller Year Month Sales
Sally Jane 2018 1 25
Sally Jane 2018 2 77
因为 Sally 的销售额在增加,而 John 的销售额在减少。
任何帮助将不胜感激!
【问题讨论】:
-
您好,将数据包含在我们可以轻松放入环境中使用的表单中会很有帮助。你可以看看stackoverflow.com/questions/5963269/…,看看如何制作一个可重现的好例子!
-
如果 John Doe 在 3 月达到 75 岁怎么办?
-
@sahir 感谢您的链接,我将努力添加一个可重现的示例!
-
我们可以假设数据是排序的吗?如果是这样,您可以使用
df[as.logical(ave(df$Sales, df$Seller, FUN = function(x) !any(x - shift(x) < 0, na.rm = TRUE))), ] -
你想如何确定增加?如果最早一个月的销售额大于最近一个月的销售额?如果他们掉在中间但又捡起来怎么办?
标签: r