【发布时间】:2020-04-25 02:03:02
【问题描述】:
我有一个推文数据集,其中每条推文都有一个平均置信度得分。
例如TweetAverage ConfidenceStandard Deviation
too much thoughts inside his headdd we can t even imagine0.30.163951
His ass need to stay up0.80.161962
First time I heard his name in camp, he seems amazing0.190.181962
平均置信度是多个监督模型预测的特定实例属于正类的置信度的平均值。
标准偏差是特定实例的置信度与平均置信度的标准偏差。
如果我认为它是一个回归任务,如何处理多标签数据
【问题讨论】:
-
你的目标是什么?
-
我想分类推文是否是正面的。但标签就像回归问题。所以我认为我应该进行回归,所以我可以判断未标记推文的信心是什么......但我很困惑
-
还是不清楚你想做什么?你的多重标签是什么?以及您要如何以及为什么要将回归引入 NLP 模型(通常是神经网络)
-
我附上了数据集的图片
-
您似乎认为有一种方法可以通过调整模型及其参数来达到 100% 理解人类语言的准确率。这与事实相去甚远。情绪分类对个别话语仍然非常不精确。当您有足够多正确分类的话语以使它们的信号优于不精确分类的噪声时,这是有意义的。
标签: python regression classification text-classification