如何提高 Rasa NLU 中意图的置信度得分？答案

【问题标题】：How to improve the confidence score of the intent in Rasa NLU?如何提高 Rasa NLU 中意图的置信度得分？
【发布时间】：2018-08-31 19:23:27
【问题描述】：

我正在使用 Rasa NLU 进行意图分类，在 link 如何提高给定意图的置信度分数。

我已尝试提供更多训练数据，但置信度分数仍然没有增加。谁能让我知道我可以调整哪些参数\超参数以获得良好的置信度得分。我确实尝试了link 中提供的所有可能的组合，但仍然几乎没有任何改进。

我确实检查了此处提供的建议，但我正在寻找模型的细粒度调整，以便它可以更好地执行。

谢谢。

编辑 1：请提供对问题投反对票的正当理由。

【问题讨论】：

您的训练数据是专有的还是可以共享的？每个意图有多少意图/训练示例？哪个管道？你的意图有多相似？你有实体吗？我觉得您没有提供足够的信息来获得更多的答案，而不仅仅是：提供更多的训练数据。
很抱歉无法共享训练数据，Intents 大约是 44 个，每个 Intent 训练不同的示例大约 1k。
听起来太合身了。就像每个意图的训练示例太多一样。

标签： nlp rasa-nlu rasa-core

【解决方案1】：

您可以使用 tensorflow_embedding 提供接近 0.9 的置信度得分，而不是使用提供整洁至 .3 的 spacy_sklearn

【讨论】：

【解决方案2】：

根据 spaCy 是否为您的语言提供良好的 language model，您应该使用 spaCy pipeline（因为它带有预训练的模型）或 tensorflow_embedding pipeline，它适用于任何语言，但需要更多的培训例子。

我认为您的问题可能是由重叠的训练示例引起的。一个澄清的例子：

## intent:ask_bot_name
- Tell me your name
- What is your name
- name please

## intent:ask_location_name
- Tell me the name
- What's the name
- name please

所以我建议查看您的训练数据，看看不同的意图是否具有相同或非常相似的示例。

【讨论】：