【问题标题】:How to correct spelling errors in a LUIS.AI application from user utterances? Use the Bing spellchecker api or label misspelled words in intents如何从用户话语中纠正 LUIS.AI 应用程序中的拼写错误?使用 Bing 拼写检查 api 或在意图中标记拼写错误的单词
【发布时间】:2019-09-20 15:52:41
【问题描述】:

此处的一篇文章对使用必应拼写检查器 api 将所有用户话语清洗到您的机器人频道中提出了一些警告。

Link to article here

当拼写检查器打开时,作为实体的点可能会变得混乱?因此,如果您有一个晦涩的单词样式实体 starblazingIT,则可以将其重构为 star blazing IT。从而伤害实体。

话虽如此,这篇文章是在 2016 年写的,所以也许这个问题已经得到解决,但我找不到任何关于它的文档。

我在上面找到的文档为忽略拼写错误和简单地标记话语提供了一个出口,LUIS 将学习正确的拼写和拼写错误......这是一个加载的语句。这到底是什么意思,路易斯是真的在学习正确的拼写还是只是在其中添加错误的拼写作为替代答案?

因为如果是这种情况,那么人们将不得不一直查看拼写错误的话语并添加变体。或者,Luis 是否会在加班训练中了解到某个特定单词可能有变体和拼写错误,并将其添加到正确的话语意图模型中?

这是link to the article 并在下面引用:

忽略拼写错误 如果您不想使用 Bing Spell Check API v7 服务,您可以标记有拼写错误的话语,以便 LUIS 可以学习正确的拼写和拼写错误。与使用拼写检查器相比,此选项需要更多的标记工作。

总体而言,您的 luis 聊天机器人应用程序的单词拼写错误纠正的最佳做法是什么?

【问题讨论】:

    标签: botframework spell-checking azure-language-understanding


    【解决方案1】:

    这里没有正确的答案,但你必须做一个或另一个。未经培训,LUIS 无法很好地处理拼写错误。例如,“我想查找我的订单”对我的 viewOrder 意图的置信度为 99.7%,但“我想查找我的 odrer”只有 36.4%,低于我的意图识别阈值。拼写检查会捕获并修复此问题。您可能在所有意图中都有几乎无穷无尽的拼写错误。因此,虽然标记新话语并不难(无论如何你都应该这样做以改进你的模型),但这将是一个持续的努力。

    我刚才做了一些测试,拼写检查似乎更能容忍混搭、行业特定术语和软件名称。例如,它不再像您链接的文章中提到的那样拆分 SmartIT。但我绝对会建议您使用实体名称进行测试,并确保它不会“更正”您不想更正的词。

    我的建议是使用必应,并在需要时修改您的实体标识(在示例文章中,可以将 SmartIT 和 Smart IT 都识别为实体)。

    【讨论】:

    • 啊,我明白你在说什么。另外,我知道通过 qna 知识库,您也可以对同义词使用单词更改,我认为这也会有所帮助。我猜本身。谢谢你的回答
    猜你喜欢
    • 2012-05-30
    • 1970-01-01
    • 2020-10-26
    • 2010-10-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2012-03-04
    • 1970-01-01
    相关资源
    最近更新 更多