【问题标题】:creating train and test datasets manually in python在 python 中手动创建训练和测试数据集
【发布时间】:2020-07-07 16:42:27
【问题描述】:

我正在尝试手动将数据集拆分为训练和测试数据集,这意味着我不想使用 scikit learn 包。我想以一种方式拆分它们,如果行索引模块 4 等于零,则将它们放入训练数据集中,否则将它们放入测试数据集中。我在 R 中完成了如下操作:

testidx = which(1:nrow(price_accommodates_bedrooms )%%4 == 0)
df_train = price_accommodates_bedrooms [-testidx, ]
df_test = price_accommodates_bedrooms[testidx, ]

但我不确定如何在 python 中执行此操作,因为我是 python 新手。提前致谢

【问题讨论】:

    标签: python dataframe machine-learning


    【解决方案1】:

    如果你想这样做,你可以利用 DataFrame 索引和掩码:

    test_df = df[df.index % 4 != 0]
    train_df = df[df.index % 4 == 0]
    

    【讨论】:

      猜你喜欢
      • 2015-07-16
      • 2017-09-11
      • 1970-01-01
      • 2019-03-21
      • 2023-02-12
      • 2020-09-24
      • 2017-02-20
      • 2019-04-20
      • 2019-12-03
      相关资源
      最近更新 更多