【发布时间】:2015-03-24 09:16:22
【问题描述】:
我正在用来自两个不同来源的数据流训练一个神经网络,启发式地:
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --oaa 10 --nn 20 --save_resume -i /tmp/weights -f /tmp/weights
但是,这会引发一个错误,即“--oaa 不能多次传递”。很好,--save_resume 保留了配置参数,所以我修改了:
cat train1.vw |vw --oaa 10 --nn 20 --save_resume -f /tmp/weights
cat train2.vw |vw --save_resume -i /tmp/weights -f /tmp/weights
一切正常。出于好奇,我重复了没有--save_resume 选项的第二种方法,一切仍然正常工作,只是模型性能稍差。
我推测--save_resume 保存了权重文件中的学习率和示例数。这似乎是从输出中发生的事情,并证实了更好的性能。还有什么吗?
编辑:经过一些实验,我发现通过-i 传递初始回归量是引发“选项'--oaa' 不能指定多次错误”而不是@987654327 @。
【问题讨论】:
标签: vowpalwabbit