【发布时间】:2017-06-23 13:20:30
【问题描述】:
我有一个包含按天销售的数据框,但由于一天有很多值,所以我想重建我的数据框,使其每天只有一个值,这是当天所有销售的总和。
我有什么:
我想要什么:
(数值计算不好,但仅用于示例)
我尝试过这样的聚合和函数,但它不起作用,我不知道该怎么做......
感谢您的帮助
【问题讨论】:
-
是的,它是重复的,但使用 data.table 很容易:
setDT(df)[, tot_by_day = sum(TOT_OP_MAIN_PAID_MNT), by = DATE_ID] -
setDT(df)[, tot_by_day = sum(TOT_OP_MAIN_PAID_MNT), by = DATE_ID]
[.data.table(setDT(df), , tot_by_day = sum(TOT_OP_MAIN_PAID_MNT), : 未使用的参数 (tot_by_day =总和(TOT_OP_MAIN_PAID_MNT)) -
您的命令应该可以工作,但我不明白为什么会出现此错误
-
这可能是由于您的列名。检查语法是否正确+如果不是这样,请不要忘记安装包并加载:
install.packages("data.table")然后require(data.table) -
现在我有了这个,我改变了类型,我测试了你的命令,我得到了这个 setDT(df)[, sum(TOT_OP_MAIN_PAID_MNT), by=DATE_ID] DATE_ID V1 1:
NA 现在我的日期在我的 df 中都是 NA
标签: r dataframe aggregate cumsum