【发布时间】:2014-07-06 02:50:03
【问题描述】:
我是 R 的新手,我找不到任何关于可以执行以下操作的包的信息:假设我有一组数据(例如,不同的文本文档),它可以有多个类.
例如,基准可以是运动、有球运动、无球运动和汽车。我希望能够预测数据属于哪个类别,考虑到我可能不会认为数据是带球的运动,但如果我正确预测它是运动,我会很高兴。
哪个包可以提供这种东西?如果可能的话,一些例子会很有用。
提前致谢
【问题讨论】:
-
你能把你的解释和例子说得更清楚吗?您是否正在寻找多标签分类器,以便每个数据可以同时属于多个类?为什么叫它分层?
-
不完全是多标签。我称之为分层,因为我必须在以下“叶子”类中分类我的数据:rec/autos、rec/motorcycles、rec/sport/baseball、rec/sport/hockey、sci/crypt、sci/med。请注意,我希望能够预测某些数据,例如至少来自 rec 类,并尝试在 rec 子类中进一步推进。这有意义吗?
-
您能否修改您的问题以显示层次结构在哪里?也许您对不是 R 的 SVMstruct (cs.cornell.edu/people/tj/svm_light/svm_struct.html) 感兴趣,但我不知道 R 中有任何结构化分类工具。也许其他人有指针?
-
@jlhoward 该文档中没有分层分类的示例。
标签: r machine-learning classification document-classification text-classification