【问题标题】:Vowpal Wabbit training and testing data formatsVowpal Wabbit 训练和测试数据格式
【发布时间】:2015-01-12 11:52:29
【问题描述】:

我正在尝试 Vowpal Wabbit,并且正在确定培训和测试所需的文件格式。我一直在关注https://github.com/JohnLangford/vowpal_wabbit/wiki/Tutorial的教程,看到下面是训练数据格式:

0 | price:.23 sqft:.25 age:.05 2006
1 2 'second_house | price:.18 sqft:.15 age:.35 1976
0 1 0.5 'third_house | price:.53 sqft:.32 age:.87 1924

对于测试数据,我没有标签或任何输出,只有特征。我将如何写出来?我试过只包括这样的功能:

price:.23 sqft:.25 age:.05 2006
price:.18 sqft:.15 age:.35 1976
price:.53 sqft:.32 age:.87 1924

但是,这给了我例外,因为它不是正确的格式。我也尝试了以下方法,结果都是 0:

| price:.23 sqft:.25 age:.05 2006
| price:.18 sqft:.15 age:.35 1976
| price:.53 sqft:.32 age:.87 1924

0 0 0 | price:.23 sqft:.25 age:.05 2006
0 0 0 | price:.18 sqft:.15 age:.35 1976
0 0 0 | price:.53 sqft:.32 age:.87 1924

任何我应该瞄准的格式,只知道功能?感谢您的帮助。

【问题讨论】:

    标签: machine-learning regression vowpalwabbit


    【解决方案1】:

    条形符号 (|) 也必须采用预测格式:

    | price:.23 sqft:.25 age:.05 2006
    | price:.18 sqft:.15 age:.35 1976
    | price:.53 sqft:.32 age:.87 1924
    

    如果你没有包含正确的标签,当然 vw 无法计算测试损失。 要获得预测,请使用vw -d test_set.vw -t -p predictions.txt。本教程中的训练集(仅包含三个示例)太小,无法训练任何合理的模型。

    【讨论】:

    • 谢谢马丁。易于记忆的规则:将每个示例行中最左边的 | 符号视为 1) 左侧要预测的内容(可以为空)和 2) 已知的内容(输入特征)之间的分隔符,在右边。
    • 如何加载我在训练时输出的现有模型?我想要的是使用所述模型以及一些测试数据将预测输出到文件中。
    • @intl 如github.com/JohnLangford/vowpal_wabbit/wiki/Tutorialvw -i house.model -t -d test.data -p predictions中所述
    猜你喜欢
    • 2021-10-13
    • 2020-01-05
    • 2014-11-09
    • 2016-04-20
    • 2016-11-29
    • 2017-05-31
    • 2020-10-22
    • 1970-01-01
    • 2020-11-07
    相关资源
    最近更新 更多