【发布时间】:2017-08-07 14:49:14
【问题描述】:
我需要实现一个多类文本分类器。我想到了使用 word2vec,有人可以引导我找到谈论这个的好论文/资源。 我将有 4-5 个课程,并且我有大量数据。我必须手动标记其中一些。如果有人能阐明训练规模,那也很棒。我打算使用预训练的 word2vec 进行词嵌入。
【问题讨论】:
标签: nlp deep-learning text-classification word2vec
我需要实现一个多类文本分类器。我想到了使用 word2vec,有人可以引导我找到谈论这个的好论文/资源。 我将有 4-5 个课程,并且我有大量数据。我必须手动标记其中一些。如果有人能阐明训练规模,那也很棒。我打算使用预训练的 word2vec 进行词嵌入。
【问题讨论】:
标签: nlp deep-learning text-classification word2vec
您可以使用 MLP 来完成这项任务,查看 Keras' example 对路透社文档进行分类。您可以在模型的开头添加一个嵌入层,并使用预训练的模型权重加载它。
请记住,有一个多类分类,它为每个输入输出一个类,并且有一个多标签分类,它可能为每个输入输出许多类(你没有说任何关于你的数据字符的东西,所以只是让你知道)。
【讨论】: