【问题标题】:Hierarchical prediction using R [closed]使用 R 进行分层预测
【发布时间】:2014-07-06 02:50:03
【问题描述】:

我是 R 的新手,我找不到任何关于可以执行以下操作的包的信息:假设我有一组数据(例如,不同的文本文档),它可以有多个类.

例如,基准可以是运动、有球运动、无球运动和汽车。我希望能够预测数据属于哪个类别,考虑到我可能不会认为数据是带球的运动,但如果我正确预测它是运动,我会很高兴。

哪个包可以提供这种东西?如果可能的话,一些例子会很有用。

提前致谢

【问题讨论】:

  • 你能把你的解释和例子说得更清楚吗?您是否正在寻找多标签分类器,以便每个数据可以同时属于多个类?为什么叫它分层?
  • 不完全是多标签。我称之为分层,因为我必须在以下“叶子”类中分类我的数据:rec/autos、rec/motorcycles、rec/sport/baseball、rec/sport/hockey、sci/crypt、sci/med。请注意,我希望能够预测某些数据,例如至少来自 rec 类,并尝试在 rec 子类中进一步推进。这有意义吗?
  • 您能否修改您的问题以显示层次结构在哪里?也许您对不是 R 的 SVMstruct (cs.cornell.edu/people/tj/svm_light/svm_struct.html) 感兴趣,但我不知道 R 中有任何结构化分类工具。也许其他人有指针?
  • 查看包tm。有一个关于如何使用该包here进行各种类型分类的教程。
  • @jlhoward 该文档中没有分层分类的示例。

标签: r machine-learning classification document-classification text-classification


【解决方案1】:

我不知道 R 中有任何特定的包可以进行分层分类。所以有两种选择:

  • 使用 C API SVMstruct http://www.cs.cornell.edu/people/tj/svm_light/svm_struct.html。从头开始在 R 中进行编程将是一项艰巨的工作。
  • 构建您自己的分层分类器系统。在自上而下的情况下,每个级别都有一个多类分类器,例如rec 与 sci 和摩托车与运动等。您将使用顶级分类器并使用其预测来选择下一个分类器。您输入的用于训练具有节点的分类器的数据是以该节点为根的子树中所有数据的并集。

有关详细信息,请阅读例如http://jmlr.org/papers/v6/tsochantaridis05a.html

【讨论】:

  • 感谢@kap 的帮助。我会尝试执行您的第二个建议,希望一切顺利
猜你喜欢
  • 2013-07-20
  • 1970-01-01
  • 2014-12-24
  • 1970-01-01
  • 2021-08-17
  • 2015-07-11
  • 2018-05-09
  • 1970-01-01
相关资源
最近更新 更多