【问题标题】:Categorical Features in Vowpal WabbitVowpal Wabbit 中的分类特征
【发布时间】:2017-10-07 15:57:56
【问题描述】:

这个link 表示目前所有的特征标签都必须跟一个浮点数。但是当我在这个validator 中输入-1 3 |context day:Monday 时,它会接受它作为具有星期一价值的特征。

此外,如果我可以将字符串作为值提供给功能,我如何提供包含空格的值。 例如-1 3 |context day:Monday name:A B 仅保留 A 作为标签名称的值,并将 B 视为另一个标签。但是,实际上,我想为标签名称分配值“A B”

【问题讨论】:

  • 检查this answer 以了解如何在vw 中表示各种类型的特征(数字、分类、二进制)

标签: categorical-data vowpalwabbit


【解决方案1】:

所有特征标签后面必须跟一个浮点数

可以,但如果没有提供冒号和浮点数,则默认特征值为 1.0。

但是当我在这个验证器中输入 -1 3 |context day:Monday 时,它接受 validator 只是近似值,并且几年没有更新。我不知道任何允许非浮动特征值的 VW 基础学习器。

解决您的问题的方法是使用空格转义分类特征值中的空格,并将具有 N 个值的分类特征转换为 N 个二元特征(最终它是相同的)。例如: -1 3 |context day_Monday name_A_B

【讨论】:

    猜你喜欢
    • 2015-04-22
    • 2014-12-08
    • 2015-12-04
    • 2016-09-21
    • 2020-10-28
    • 2017-08-23
    • 2016-01-05
    • 2015-12-10
    • 2016-02-08
    相关资源
    最近更新 更多