【问题标题】:Automatic classification items in the store, is it possible?店内商品自动分类,可以吗?
【发布时间】:2016-01-05 03:44:18
【问题描述】:

我有一个商店中商品的数据库。它们都是蔬菜、水果、坚果、浆果等……我需要对它们进行分类。例如,我应该将不同类型的土豆归为一组 - 马铃薯、西红柿 - 番茄等……

最直观的方法是使用规则进行分组,例如,如果项目名称包含单词potato,则应将其分组在类别potatoes等下...

但是有很多类别,我正在寻找自动方法。例如在一组项目中寻找最常见的词。

我确定我不是第一个解决此类问题的人,因此应该已经解决了,至少部分解决了。也许有一些图书馆可以帮助我,神经网络。

提前谢谢你。

附:最好的解决方案是基于 Java 的解决方案,但不是必须的。

【问题讨论】:

    标签: neural-network classification categories text-classification


    【解决方案1】:

    根据我从您(尽管缺少)示例中了解到的情况,您可以执行以下操作:

    1. 标记化(在您的情况下 - 只是拆分成单词,删除标点符号)
    2. 词干提取(Porter 词干分析器会做)
    3. 删除停用词

    你就完成了。您可以将结果用于标记/分类。 关于 SO 处理这些过程有很多问题,例如: Tokenizer, Stop Word Removal, Stemming in Java

    【讨论】:

      猜你喜欢
      • 2021-09-27
      • 1970-01-01
      • 2014-09-27
      • 1970-01-01
      • 1970-01-01
      • 2011-03-19
      • 2012-12-05
      • 2023-03-26
      • 2019-12-27
      相关资源
      最近更新 更多