【发布时间】:2021-09-11 19:38:10
【问题描述】:
我想从旧的数据表中创建一个新的数据表,其中包括每个日期出现的所有“article_id”的计数(即,列出了日期 2001-10-01 的三个 article_id,所以我'想要一列包含日期,一列包含文章计数“3”)。
这是数据表的输出:
date article_id N
1: 2001-09-01 FAS_200109_11104 3
2: 2001-10-01 FAS_200110_11126 6
3: 2001-10-01 FAS_200110_11157 21
4: 2001-10-01 FAS_200110_11160 5
5: 2001-11-01 FAS_200111_11220 26
---
7359: 2019-08-01 FAZ_201908_2958 7
7360: 2019-09-01 FAZ_201909_3316 8
7361: 2019-09-01 FAZ_201909_3515 13
7362: 2000-12-01 FAZ_200012_92981 3
7363: 2001-08-01 FAZ_200108_86041 14
所以我必须将唯一的日期值转移到一个新的数据框(这样每个日期只显示一次),以及每个日期显示的 article_id 计数。
我一直在试图弄清楚这一点,但还没有找到关于如何按组(日期)计算字符向量(article_id)出现的确切答案。我认为这在 R 中很简单,但我是该程序的新手,没有太多支持,所以我非常感谢您的建议 - 非常感谢!
【问题讨论】:
-
你想要每个“日期”的
N的总和,即dt[, .(N = sum(N)), date]