【发布时间】:2019-09-05 08:30:42
【问题描述】:
前提:我正在使用ML Luis framework 开发聊天机器人。这基本上是一个黑盒框架,我不知道如何以正确的方式调整它来解决这个问题。
我的聊天机器人有两个意图/类。为简单起见说:
- 喜欢
- 不喜欢
是两个所说的意图。在我的训练集中,我有两个课程:
喜欢类:
我喜欢
我喜欢猫
我真的很喜欢老鼠
不喜欢类:
我不喜欢它
我不喜欢海豚
我真的不喜欢狗
这两个类对于训练集短语非常相似,当我尝试对属于两个类之一的短语进行一些预测时,分数非常接近,例如:
I like armadillos -> 0.86 like | 0.8 don't like
基本上,这两个域/类有很大的重叠,并且只有一个词不同(不要,如示例中所示)。有没有办法有效地训练模型(使用 Luis1)增加相似话语之间的分数差异?
【问题讨论】:
-
尝试为否定词“不喜欢”、“不喜欢”添加短语列表,然后查看推荐的词组以添加更多。另外添加针对这两个意图的模式。
标签: machine-learning nlp chatbot azure-language-understanding disambiguation