【发布时间】:2021-06-29 08:08:00
【问题描述】:
在我的数据集中,我有两列。 POINT:仅包含在整个数据集中重复的两个分类值“随机”和“当前”。 ID:包含一组与 POINT 中的值关联的 5 位连续值。 ID 中的某些值是重复的。
当与“当前”相比,POINT 值为“随机”时,我无法找出 R 中的代码来仅消除 ID 列中具有重复值的原始数据。所以我想要下面的数据集:
| POINT | ID |
|---|---|
| Current | 45905 |
| Current | 40817 |
| Current | 55936 |
| Current | 66608 |
| Current | 66608 |
| Random | 45905 |
| Random | 40817 |
| Random | 55936 |
| Random | 66608 |
| Random | 44456 |
看起来像这样:
| POINT | ID |
|---|---|
| Current | 45905 |
| Current | 40817 |
| Current | 55936 |
| Current | 66608 |
| Current | 66608 |
| Random | 44456 |
【问题讨论】:
-
对不起,我在第二个表的编码中遗漏了一些东西,希望这是有道理的。
-
欢迎使用 *!我不太明白你问题的这一部分:“与‘当前’相比,当 POINT 值是‘随机’时。”您的意思是,对于重复的 ID,您何时有两个 Point 值:随机和当前?
标签: r duplicates