【发布时间】:2019-01-25 23:14:07
【问题描述】:
我的团队进行了大量的聊天机器人培训,我正在尝试提供一些工具来提高我们的工作质量。在聊天机器人训练中,训练具有不同表达方式的意图非常重要,这些表达方式以非常不同的方式表达相同的意图。理想情况下,集合中话语的语法几乎没有相似之处。
这是一个查询医疗保险范围的意图示例
糟糕的话语集
- 我女儿有保险吗?
- 我儿子有医疗保险吗?
- 我儿子有保险吗?
体面的话语集
如何查询我们是否为全家投保?
寻求医疗保险资格的详细信息
是否有文件详细说明我们的医疗保险政策保护的对象?
我希望能够获取与意图相关的所有话语并分析它们的相似性。我希望我的一组不好的话语具有较高的相似度得分,而我的一组体面的话语具有较低的相似度分数。
我尝试过一些 doc2vec 教程,但我觉得我错过了一些东西。我经常看到这样的东西:
- 训练一组数据,然后衡量一个新句子与您的一组数据的相似度
- 衡量两个句子之间的相似度
我需要有一组句子并了解它们之间的相似程度。
对实现这一点有什么建议吗?
回答一些问题:
- 是什么让糟糕的话语变得糟糕?话语本身并不糟糕,只是它们之间缺乏多样性。如果大部分训练都像“坏”集一样,那么将无法正确识别更多种类的真实用户话语。
- 您是否正在尝试发现新的意图?不,这是针对发布前培训的,旨在提高它的有效性。
- 为什么不好的话语具有高相似性分数而良好的话语具有低相似性分数?这是一个假设。我知道真实的用户话语有多么不同,我发现我的培训师在训练时陷入了困境,以同样的方式提出问题,并且没有看到良好的准确性结果。改善话语的多样性往往会提高准确性。
- 我将如何处理这些信息?我将使用它来评估意图的训练质量,以确定是否可能需要更多的训练。将来我们可能会构建实时工具,因为正在添加话语以让培训师知道它们是否过于重复。
【问题讨论】:
-
您能否在问题中澄清一下:(1)是什么让“坏话”变得不好? (2) 是否所有话语都已与意图相关联,或者您是否正在尝试发现新意图和/或将新话语与先前意图相关联? (3) 为什么你期望“坏”的话语具有高相似度(彼此之间?),而“体面”的话语具有低相似度分数? (4) 最终目标是什么——你打算如何处理模拟分数?如果一对句子(或组内的所有句子对)有“high sim”或“low sim”,你将如何处理这些信息?舍弃一些句子?
-
好问题。我会在原始问题中给出答案
-
@gojomo 让我知道我所做的编辑是否回答了您的问题
-
这很有帮助......所以看起来真正的目标是确定这些句子(意味着作为某些其他过程/算法的训练输入)具有大量表面种类?因此,向一些人类培训师提供反馈,促使他们生成更好(更多样化)的示例?
-
@gojomo 没错
标签: machine-learning nlp word2vec doc2vec sentence-similarity