【问题标题】:NLP classification training modelNLP分类训练模型
【发布时间】:2018-02-13 18:25:41
【问题描述】:

我正在尝试训练一个模型来使用 opennlp 对推文进行分类。我的问题是我应该对用于训练模型的推文执行标记化、停用词删除等,还是应该直接使用推文而不执行清理?

【问题讨论】:

  • 你的模型想要完成什么?

标签: nlp stanford-nlp opennlp


【解决方案1】:

这真的取决于你在训练什么:

  • 如果您的算法旨在接收简单文本,并且在对其使用机器学习技术之前自行执行所有简化,则您应该提供类型对
  • 否则,如果您只是试用一个黑匣子,我会说如果您的模型要处理某种类型的特征,那么在您的情况下,它应该使用这种类型的数据进行训练,因此提供 李>

【讨论】: