【发布时间】:2023-10-22 20:38:01
【问题描述】:
我正在寻找一种使用 python 库解决以下问题的好方法:
我有一个数据集,其中有一列包含产品描述。此列中的值可能非常混乱,并且会有很多与产品无关的其他词。我想知道哪些行是关于同一产品的,所以我需要用它的主要主题标记每个描述句子。例如,如果我有以下内容: “500 件鞋绿色运动网球进口海外塑料”,我希望标签类似于:“鞋”、“运动”。所以我正在寻找一种方法来对句子进行语义标记,而不是词性标记。假设我没有标记(标记)数据进行训练。
任何帮助将不胜感激。
【问题讨论】:
标签: python-2.7 nlp nltk gensim semantic-analysis