【发布时间】:2012-11-08 06:18:53
【问题描述】:
半监督学习使用一组标记数据(L)训练一个模型来预测一组未标记数据(U),然后将新的标记数据(L')和原始标记数据(L)分组为完整的标记数据。
我想问一下如何提取测试数据。
- 我应该从 (L union L') 中提取测试数据
- 我应该从 (L) 中提取测试数据
哪个是对的?
如果测试数据是从(L union L')中提取出来的,结果没有意义,因为L'中的答案可能是错误的...?
================================================ =========== 编辑新的
我有另一个想法.....
3。 我应该在开始时将标记数据(L)拆分为训练数据(L_train)和测试数据(L_test)。
然后用L_train训练一个模型,用它来预测一组未标记的数据(U),然后对预测结果(L')和L_train进行分组。
并且,使用 (L_train union L') 训练模型以在 L_test 上进行测试。
1,2,3 中哪一个是对的? 感谢您的回复。
【问题讨论】:
-
你的问题不清楚。听起来L'是测试数据。
标签: testing machine-learning training-data