【问题标题】:Is this training dataset enough for training and testing classification model?这个训练数据集是否足以训练和测试分类模型?
【发布时间】:2015-10-25 19:21:14
【问题描述】:

我的训练数据集仅包含 2 个具有 40 个特征的类。

在案例 1 中,第 1 类有 35 个样本,第 2 类有 700 个样本。

在情况 2 中,类 1 有 65 个样本,类 2 的值与上述相同。

我的训练数据集是否足以使用 SVM 分类器或其他分类器构建模型?

我正在使用 WEKA。测试选项有 10 倍交叉验证%66,我得到了非常好的结果。

【问题讨论】:

    标签: machine-learning weka svm training-data sample-size


    【解决方案1】:

    您对结果感到满意,因此这意味着您有足够的数据。很难说您需要多少数据,这取决于您要解决的具体问题、数据中有多少噪音、有哪些特征等。

    我在第二部分中描述了它:https://stackoverflow.com/a/31567143/1030820

    【讨论】:

      猜你喜欢
      • 2016-04-04
      • 2018-06-04
      • 2019-04-22
      • 2019-10-11
      • 2019-05-01
      • 2018-01-01
      • 1970-01-01
      • 1970-01-01
      • 2017-11-01
      相关资源
      最近更新 更多