【问题标题】:Test Train Split in python在 python 中测试火车拆分
【发布时间】:2018-01-23 20:05:14
【问题描述】:

test_size,random_statestratify 在 python 中的训练测试拆分中是什么意思?

我的代码如下:

from sklearn.cross_validation import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y,test_size = 0.25, random_state =0)

knn = KNeighborsClassifier()
knn.fit(X_train, Y_train)



from sklearn.cross_validation import train_test_split
X_train, X_test, Y_train, Y_test = train_test_split(X, Y,stratify=Y, random_state=42)

knn = KNeighborsClassifier()
knn.fit(X_train, Y_train)

【问题讨论】:

    标签: training-data


    【解决方案1】:

    test_size : float, int, None, optional

    如果是float,应该在0.0到1.0之间,代表比例 要包含在测试拆分中的数据集。如果是 int,则表示 测试样本的绝对数量。如果为 None,则将该值设置为 火车尺寸的补充。默认情况下,该值设置为 0.25。 默认值将在 0.21 版本中更改。只有当它保持 0.25 train_size 未指定,否则补指定 火车尺寸。

    train_size : float, int, or None, default None

    如果是float,应该在0.0到1.0之间,代表比例 要包含在火车拆分中的数据集。如果是 int,则表示 训练样本的绝对数量。如果没有,值是自动的 设置为测试大小的补码。

    random_state : int, RandomState instance or None, optional (default=None)

    如果是int,则random_state是随机数生成器使用的种子; 如果是 RandomState 实例,则 random_state 是随机数生成器; 如果没有,随机数生成器是使用的 RandomState 实例 通过 np.random。

    你可以在http://scikit-learn.org/stable/modules/generated/sklearn.model_selection.train_test_split.html的文档中找到所有这些解释

    【讨论】:

      猜你喜欢
      • 2020-05-21
      • 2017-02-21
      • 2020-08-03
      • 2017-09-05
      • 1970-01-01
      • 2020-05-11
      • 1970-01-01
      • 2020-11-29
      • 2018-12-29
      相关资源
      最近更新 更多