【发布时间】:2025-11-27 05:05:02
【问题描述】:
我有一个数据框,列数超过 150 个,例如
df <- data.frame(name = c("Andy", "Bob", "Andy", "Cha", "Andy", "Bob", "Dil"),
num = c(1,NA, 0,NA, 1, NA, 0),
place=c("Andy", "Bob", "Andy", "Cha", "Andy", "Bob", "Dil"))
它将数据框显示为
name num place
1 Andy 1 Andy
2 Bob NA Bob
3 Andy 0 Andy
4 Cha NA Cha
5 Andy 1 Andy
6 Bob NA Bob
7 Dil 0 Dil
现在我看到,虽然变量名name 和place 不同,但第1 列(name)和第3 列(place)的值是相同的。我的数据框中有 150 列。所以我想找出与名为name的变量(第1列)代表相似类型信息的变量。
【问题讨论】:
-
您可以使用
duplicated.default对附加内容进行子集化,例如df[!duplicated.default(df)] -
我的数据框中有 150 列。变量“地点”就是其中之一。所以我想找出与名为“name”(column1)的变量代表相似类型信息的变量。在初始级别,我不知道变量“地点”。我必须找出变量“地点”列
-
如果你想要重复,
names(df)[duplicated.default(df)]