R数据框问题中的子集列？

【问题标题】：Subset columns in R dataframe issue?R数据框问题中的子集列？
【发布时间】：2018-05-18 03:49:53
【问题描述】：

我有一个数据框 df，我想通过以下方式对其进行子集化：

第 1-7 列和列 cols 的向量：

cols = c("rs1057079", "rs1057079.1", "rs4845882", "rs4845882.1", "rs1891932", "rs1891932.1", "rs530296", "rs530296.1", "rs10497340", "rs10497340.1")

所以我所做的是 df[, c(1:7, cols)] 但 R 抛出一个错误：

Error in `[.data.frame`(df, , c(seq(1:7), SNPs_dup)) : 
  undefined columns selected

这里有什么问题？？我可以在 1:7 和 cols 上设置子集，但为什么不能同时使用它们？

【问题讨论】：

【解决方案1】：

c(1:7, cols) 将序列1:7 强制转换为被进一步视为列名'1', '2' ... 而不是列位置的字符，您可以提取1-7 列名，然后与cols 和子集连接：

df[,c(names(df)[1:7], cols)]

或将cols 转换为职位：

df[,c(1:7, match(cols, names(df)))]

【讨论】：