【发布时间】:2018-11-23 11:34:39
【问题描述】:
我有兴趣使用 DeepPavlov 聊天机器人框架进行文本分类。
问题是我没有足够的训练数据。理想情况下,我希望每个类只使用少量样本进行文本分类。
【问题讨论】:
标签: nlp artificial-intelligence chatbot
我有兴趣使用 DeepPavlov 聊天机器人框架进行文本分类。
问题是我没有足够的训练数据。理想情况下,我希望每个类只使用少量样本进行文本分类。
【问题讨论】:
标签: nlp artificial-intelligence chatbot
您应该查看DeepPavlov's autoFAQ models。专门开发了一些模型,以便在训练数据有限时发挥作用。
可供您使用的模型很少
基于 tf-idf 的模型
fastText 模型
两者兼而有之
在配置文件中更改数据集源,通过运行训练模型
python -m deeppavlov train tfidf_logreg_en_faq
您可以通过命令行与经过训练的模型进行交互
python -m deeppavlov interact tfidf_logreg_en_faq -d
或通过 Python 代码
from deeppavlov.core.commands.infer import build_model
faq = build_model("tfidf_logreg_en_faq", load_trained = True, download = True)
a = faq(["I need help"])
a
你可以在colab notebook找到所有需要的代码sn-ps
【讨论】: