【问题标题】:LUIS - Similar training utterances for two chatbot intentsLUIS - 两个聊天机器人意图的类似训练话语
【发布时间】:2019-09-05 08:30:42
【问题描述】:

前提:我正在使用ML Luis framework 开发聊天机器人。这基本上是一个黑盒框架,我不知道如何以正确的方式调整它来解决这个问题。

我的聊天机器人有两个意图/类。为简单起见说:

  • 喜欢
  • 不喜欢

是两个所说的意图。在我的训练集中,我有两个课程:

喜欢类:

我喜欢

我喜欢猫

我真的很喜欢老鼠

不喜欢类:

喜欢它

喜欢海豚

我真的喜欢狗

这两个类对于训练集短语非常相似,当我尝试对属于两个类之一的短语进行一些预测时,分数非常接近,例如:

 I like armadillos -> 0.86 like | 0.8 don't like

基本上,这两个域/类有很大的重叠,并且只有一个词不同(不要,如示例中所示)。有没有办法有效地训练模型(使用 Luis1)增加相似话语之间的分数差异?

【问题讨论】:

  • 尝试为否定词“不喜欢”、“不喜欢”添加短语列表,然后查看推荐的词组以添加更多。另外添加针对这两个意图的模式。

标签: machine-learning nlp chatbot azure-language-understanding disambiguation


【解决方案1】:

LUIS 主要使用conditional random field (CRF) 来提取实体(请参阅here)。由于 CRF 概率是根据单词序列计算的,在您的情况下,您无法更改 LUIS 中的任何因素。因为这两种情况下的单词顺序非常相似。

要解决此问题,您可以在 LUIS 之外进行一些处理,或者为 LUIS 准备更多话语以识别差异。但是,后一种解决方案可能没有我在第一段中解释的那么大。

【讨论】:

    猜你喜欢
    • 2017-06-12
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2020-01-14
    • 1970-01-01
    • 2020-02-09
    • 1970-01-01
    • 2020-07-30
    相关资源
    最近更新 更多