【发布时间】:2016-07-20 02:22:04
【问题描述】:
我一直在从事一个项目,该项目要求我根据产品描述提供关键字/关键词建议。
我目前拥有的:产品描述、产品类别(可能存在也可能不存在)。
我想要什么:根据描述机器生成的关键字/关键词。
我做了什么研究:(基于 NLP 的方法)这个问题可以分解为两种不同的方法。
- 不使用过去的数据:仅总结当前描述
- 方法:- 分词、词干、停用词删除等(预处理)
- 浅 NLP(选区解析)并仅保留 NP 和 JJ 短语。
这将是一种不使用数据库中存在的描述的方法。
我一直在寻找一种更好的方法,它使用 ML 算法并使用我过去的产品描述数据。
我正在考虑对整个数据集应用浅解析,然后给出在 N 多个产品中遇到的关键字。
什么算法或方法会派上用场? 如何使用我的数据?
【问题讨论】:
-
您是否有大量带有关键字的产品可用于学习?
-
是的,我确实有与“某些”产品描述相关的关键字。
标签: algorithm machine-learning nlp keyword