【发布时间】:2026-02-05 14:50:01
【问题描述】:
我觉得这应该是直截了当的,但我想不通。我想从数据框中按组选择第二个观察值。
例如:
Row Number Email
1 xxxx
2 xxxx
3 xxxx
4 xxxx
5 xxxx
6 yyyy
7 yyyy
8 zzzz
9 zzzz
10 zzzz
11 zzzz
12 zzzz
我想要:
Row Number Email
2 xxxx
7 yyyy
9 zzzz
似乎 data.table 解决方案和聚合解决方案正在跳过他们应该捕获的电子邮件组。以下是它应该捕获的前六秒行:
Row Number emails expected output actual output
1 aaaa
2 aaaa aaaa aaaa
3 aaaa
4 aaaa
5 aaaa
6 aaaa
7 aaaa
8 bbbb
9 bbbb bbbb bbbb
10 cccc
11 cccc cccc cccc
12 cccc
13 cccc
14 cccc
15 cccc
16 cccc
17 dddd NA
18 eeee
19 eeee eeee
20 eeee
21 ffff
22 ffff ffff ffff
email 'eeee' 在数据集中有一行,所以我希望这一行有一个 NA 行。 email 'dddd' 在原始数据集中有三行,所以我希望这封电子邮件的第二行,但它不存在。
【问题讨论】:
-
每组电子邮件。对于所有等于“xxxx”的电子邮件,选择第二个观察值。对不起,也许我误用了这个词。它们在我的完整数据集中按时间排序
标签: r