【发布时间】:2021-10-08 13:40:34
【问题描述】:
我正在尝试创建一个可以找到相似句子的 NLP 模型。例如,应该可以说“Software Engineer”、“Software Developer”、“Software Dev”、“Soft Engineer”是相似的句子。
我有一个数据集,其中包含一系列角色,例如首席执行官、软件工程师,这些术语的变体将是未知的(超出词汇表)。
我正在尝试将 fastText 与 Gensim 一起使用,但遇到了困难。 有没有人推荐过可能对我有帮助的阅读材料/教程?
【问题讨论】:
-
我投票结束这个问题,因为它属于Data Science Stack Exchange 论坛,因为它与编程问题没有直接关系。请把问题移到那里。
-
我明白了。谢谢
标签: machine-learning nlp gensim fasttext