【发布时间】:2020-04-01 20:13:55
【问题描述】:
我已经训练了一个 spacy textcat 模型,但后来我意识到有一些不正确的训练数据:来自一个类别的数据恰好被标记为另一个类别。我的问题是:是否可以在不重新训练的情况下从模型中删除这些训练示例?类似nlp.update() 但反过来?非常感谢任何帮助!
【问题讨论】:
标签: python spacy text-classification
我已经训练了一个 spacy textcat 模型,但后来我意识到有一些不正确的训练数据:来自一个类别的数据恰好被标记为另一个类别。我的问题是:是否可以在不重新训练的情况下从模型中删除这些训练示例?类似nlp.update() 但反过来?非常感谢任何帮助!
【问题讨论】:
标签: python spacy text-classification
您的意思是还原特定案例?据我所知,目前在 spaCy 中这是不可能的。
我建议要么使用更正的注释从头开始重新训练,要么使用更新的注释继续训练。如果您继续训练,请确保您继续为您的模型提供一个代表集,这样它就不会“忘记”它之前已经正确预测的案例。
【讨论】:
representative set 下的意思是什么?我之前遇到过这个词,但没明白它的意思