【问题标题】:-train function does not subset the dataset [duplicate]-train 函数不会对数据集进行子集化
【发布时间】:2020-09-28 00:18:14
【问题描述】:

使用 train 函数,我正在尝试创建两个子数据集。我的原始数据集有 2215 个观察值(UCI_CC_cleaned)。使用下面的代码,我可以创建包含 575 个观察值的训练数据集 (UCI.train),但测试数据集的维度不正确。我期待 2215-575 个观测值,但它包含 2214 个观测值。

   train <- UCI_CC_cleaned$random >0.75
          UCI.train <- UCI_CC_cleaned[train, ]
  UCI.test <- UCI_CC_cleaned[-train, ]

【问题讨论】:

    标签: r subset


    【解决方案1】:

    train 中有一个逻辑向量,尝试使用! 反转符号。

    train <- UCI_CC_cleaned$random > 0.75
    UCI.train <- UCI_CC_cleaned[train, ]
    UCI.test <- UCI_CC_cleaned[!train, ]
    

    您可以使用which 来使用-

    train <- which(UCI_CC_cleaned$random >0.75)
    UCI.train <- UCI_CC_cleaned[train, ]
    UCI.test <- UCI_CC_cleaned[-train, ]
    

    【讨论】:

      猜你喜欢
      • 2019-09-26
      • 2017-11-21
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2016-07-02
      • 1970-01-01
      相关资源
      最近更新 更多