【发布时间】:2020-09-19 16:46:42
【问题描述】:
我目前正在使用 python 中的小型应用程序,并且我的应用程序具有搜索功能(目前使用 difflib)但我想创建 语义搜索 根据用户输入的文本,它可以从我的数据库中给出前 5 或 10 个结果。它与谷歌搜索引擎的工作方式相同。我找到了一些解决方案Here。
但问题是,以下来自一个解决方案的两个语句在语义上是不正确的。我不在乎这个。因为他们让事情变得太难了,这是我不想要的,而且解决方案将是一些预训练的神经网络模型或库,我可以从中轻松实现。
- Pete 和 Rob 在车站附近发现了一条狗。
- Pete 和 Rob 从未在车站附近找到过狗
我还发现了一些解决方案,这些解决方案显示使用 gensim 和 Glove 嵌入并发现单词之间的相似性而不是句子之间的相似性。
我想要什么?
假设我的数据库有声明 display classes 和用户输入 show、showed、displayed、displayed class、show types 等是相同的。如果以上 2 个陈述相同,那么我也不在乎。 displayed 和 displayed class 已经显示在 difflib 中。
注意事项
- 从固定的语句集中查找,但用户输入的语句可能不同
- 必须适用于语句
【问题讨论】:
标签: python-3.x nlp