【发布时间】:2020-04-16 19:56:33
【问题描述】:
我有一个数据集,其中包含 N 条带有 5 大个性特征(extroverted、stable、agreeable、conscientious 和 open)注释的推文。每个类别由一个实数表示。
我想预测文档中每个人格特质的分数,但我不知道我应该如何处理这个任务。
一种可能性是将其拆分为 5 个不同的回归任务,但随后分类器可能会遗漏 5 个类别之间的相关性(例如,某人 extroverted 编写的文档有更高的概率作者也是 open) .
另一种是应用多标签方法,但我认为这是不可能的,因为当有标签而不是真实值(分类而不是回归)时会应用这种方法,不是吗?
【问题讨论】:
-
你是想预测性格特征还是获得一些与之相关的分数?
-
获取分数。
-
我的朋友,这是一个统计问题,而不是编程问题。我会说它属于像 Cross Validated 这样的地方。
-
你说得对,我会关闭它。谢谢
标签: python regression classification multilabel-classification