【问题标题】:How to improve the confidence score of the intent in Rasa NLU?如何提高 Rasa NLU 中意图的置信度得分?
【发布时间】:2018-08-31 19:23:27
【问题描述】:

我正在使用 Rasa NLU 进行意图分类,在 link 如何提高给定意图的置信度分数。

我已尝试提供更多训练数据,但置信度分数仍然没有增加。谁能让我知道我可以调整哪些参数\超参数以获得良好的置信度得分。 我确实尝试了link 中提供的所有可能的组合,但仍然几乎没有任何改进。

我确实检查了此处提供的建议,但我正在寻找模型的细粒度调整,以便它可以更好地执行。

谢谢。

编辑 1:请提供对问题投反对票的正当理由。

【问题讨论】:

  • 您的训练数据是专有的还是可以共享的?每个意图有多少意图/训练示例?哪个管道?你的意图有多相似?你有实体吗?我觉得您没有提供足够的信息来获得更多的答案,而不仅仅是:提供更多的训练数据。
  • 很抱歉无法共享训练数据,Intents 大约是 44 个,每个 Intent 训练不同的示例大约 1k。
  • 听起来太合身了。就像每个意图的训练示例太多一样。

标签: nlp rasa-nlu rasa-core


【解决方案1】:

您可以使用 tensorflow_embedding 提供接近 0.9 的置信度得分,而不是使用提供整洁至 .3 的 spacy_sklearn

【讨论】:

    【解决方案2】:

    根据 spaCy 是否为您的语言提供良好的 language model,您应该使用 spaCy pipeline(因为它带有预训练的模型)或 tensorflow_embedding pipeline,它适用于任何语言,但需要更多的培训例子。

    我认为您的问题可能是由重叠的训练示例引起的。一个澄清的例子:

    ## intent:ask_bot_name
    - Tell me your name
    - What is your name
    - name please
    
    ## intent:ask_location_name
    - Tell me the name
    - What's the name
    - name please
    

    所以我建议查看您的训练数据,看看不同的意图是否具有相同或非常相似的示例。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 2018-01-06
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2020-10-16
      • 1970-01-01
      • 1970-01-01
      相关资源
      最近更新 更多