【问题标题】:libsvm input data?libsvm 输入数据?
【发布时间】:2012-05-11 10:13:18
【问题描述】:

例如,我有一个这样的 n 个人的数据集

userID 1 (or 2,3.....up to n)
gender male (or female)
working yes (or No)
income >$5000/month (or <$5000)
have_car yes (or no)

我想根据其他属性(性别、工作和收入)预测一个人是否拥有汽车。我应该使用什么格式进行培训,我应该投入多少人进行培训,如果假设我有 10,000 人的数据,则需要多少人进行测试

【问题讨论】:

    标签: libsvm


    【解决方案1】:

    格式:您必须使用数字数据。所以 use 可以使用 0 和 1 进行二进制判定。

    培训/测试:没有确切的公式。您似乎没有很多用于分类的功能 - 这意味着您不一定需要大量的训练数据。您可以一开始就将其拆分为 50:50,然后检查您是否获得了合理的结果。

    【讨论】:

      猜你喜欢
      • 2011-03-24
      • 2011-07-14
      • 2012-04-08
      • 1970-01-01
      • 2015-09-22
      • 2012-08-20
      • 2015-07-01
      • 2014-01-17
      • 2017-03-19
      相关资源
      最近更新 更多