【问题标题】:best approach to analyze text in PHP?在 PHP 中分析文本的最佳方法?
【发布时间】:2009-07-03 10:27:55
【问题描述】:

我需要分析用户的帖子并对其进行分类。例如:我必须根据文本将每个帖子分类为“购买”帖子或“出售”帖子 - “我正在寻找出售我的房子”被归类为“出售”。问题是它通常不是那么简单 - “我正在寻找摆脱我的旧房子”也需要归类为“出售”。 “我在找房子”变成了“买”。我还想根据相关项目对这些帖子进行分类 - 例如,上面的帖子将被分类为“购买”和“房子”。

在分析和理解用户输入时,谁能推荐一个好的方法/好的框架/技术? 谢谢。

【问题讨论】:

  • 为什么不包括一个买/卖单选按钮组合?
  • 正如我所说,我不仅需要购买/出售商品,还需要了解商品的类型。我可以添加单选按钮和下拉列表,但我想要更聪明的东西。如果系统不理解这个人写的内容,也许可以作为后备。

标签: php user-input analyzer


【解决方案1】:

您所说的基本上是Bayesian filtering problem,也用于垃圾邮件过滤。另见this talk。这是一个相当复杂的领域。

【讨论】:

    【解决方案2】:

    你是对的;这是一件很难的事情。

    雅虎!有一个可以使用的Term Extraction API/Web 服务。这是在您自己的文本上使用语言分析的一种非常好的方法,而无需自己编写一百万行代码。我没有使用它,所以我不知道它与您的问题所问的类似含义的效果如何。

    【讨论】:

      猜你喜欢
      • 2010-09-24
      • 2010-09-08
      • 2010-09-06
      • 1970-01-01
      • 1970-01-01
      • 2010-09-06
      • 2010-09-06
      • 2011-04-06
      相关资源
      最近更新 更多