【发布时间】:2015-10-15 17:45:46
【问题描述】:
我有一个包含 40 列,每列 100.000 行的数据集。因为列数太大,我想删除其中的一些。我想从 10.000-20.000 中删除行;从 30.000-40.000 和从 60.000-70.000;这样我就有了一个包含 40 列和 70.000 行的数据集。第一列是一个以 1 开头的 ID(称为 ItemID),最后一个以 100.000 结尾。谁能帮帮我。
尝试删除从 10000 到 20000 的列,但它不起作用(让数据集称为“数据”):
Data <- Data[Data$ItemID>10000 && Data$ItemID<20000]
【问题讨论】:
-
不是确切的行:用 ] 关闭它
-
做
toremove = c(10000:20000, 30000:40000, 60000:70000); Data[!Data$ItemID %in% toremove,] -
或者干脆
subset(Data, !ItemID %in% c(10000:20000, 30000:40000, 60000:70000))
标签: r