【发布时间】:2018-06-14 04:14:43
【问题描述】:
目前,我们正在使用 Bot 框架 SDK(问答场景)构建知识库机器人,我们在 Azure 搜索中对数据进行索引,索引的结构包含可搜索的 Edm.String (de.Microsoft) 属性,例如(纯文本、标题)和可搜索的 Collection(Edm.String) (de.Microsoft) 属性,例如(关键字、产品类别和共同问题)。
相互问题将由管理员通过自定义 UI 提供,所以我的问题是最好存储(索引)管理员提供的相互问题,或者最好在删除后索引相互问题停用词/干扰词?
正如您所知,将使用该机器人的最终用户不会使用与原样相同的索引问题,他们可能会以不同的差异来制定问题,我已经进行了一些手动测试,并且我发现场景越来越好当关键字被删除时,在其他情况下更糟,我只想了解当 Azure 搜索查询字符串数据类型列表的可搜索属性时发生了什么。
我在发送搜索请求时使用 searchMode: any 和 queryType: full词和删除它们之后。
示例 1
"MutualQuestions": [
"Kann ich im Konto ein individuelles Entgelt anlegen, obwohl es im Produkt keines gibt?",
"Ich möchte eine andere Zinsberechnungsmethode als im Produkt einstellen."
],
"MutualQuestionsNoNoise": [
"Konto individuelles Entgelt anlegen, Produkt",
"Zinsberechnungsmethode Produkt einstellen."
]
示例 2
{
"MutualQuestions": [
"Wo binde ich Produkte auf der Internetseite ein?",
"Wie binde ich Produkte in die Internetseite ein?"
],
"MutualQuestionsNoNoise": [
"binde Produkte Internetseite"
]
}
提前致谢
【问题讨论】:
标签: azure azure-cognitive-search