【问题标题】:Split dataset into training and test by month按月将数据集拆分为训练和测试
【发布时间】:2019-12-11 10:34:44
【问题描述】:

我无法在任何地方找到答案。我有三个月的数据,我想把它分成前两个月('Jan-19','Feb-19')作为训练集,最后一个月作为测试集('Mar-19')。

以前我用这样的简单代码进行了随机抽样:

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.30,random_state=109)

在此之前,将 y 指定为标签,将 x 作为用于预测的列。我不确定如何将测试和培训分配到我想要的月份。

谢谢

【问题讨论】:

    标签: python neural-network training-data test-data


    【解决方案1】:

    如果您的数据在 pandas 数据框中,您可以像这样使用子集:

    X_train = X[X['month'] != 'Mar-19']
    y_train = y[X['month'] != 'Mar-19']
    
    X_test = X[X['month'] == 'Mar-19']
    y_test = y[X['month'] == 'Mar-19']
    
    

    【讨论】:

    • 乐于助人!如果此答案或此处的任何其他答案解决了您的问题,请将其标记为已接受。谢谢!
    【解决方案2】:

    你试试这个选项,看看是否有帮助。

    dataset_train = df['2004-02-12 11:02:39':'2004-02-13 23:52:39']
    dataset_test = df['2004-02-13 23:52:39':]
    

    【讨论】:

      猜你喜欢
      • 2019-05-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2021-02-27
      • 2021-05-09
      • 2017-11-01
      • 2019-12-15
      相关资源
      最近更新 更多