【发布时间】:2026-02-15 00:45:01
【问题描述】:
我已经计算了每个方面的一些值,并使用 sentiwordnet 确定了它的极性。
例如,这部电影很棒。这里的电影是一个方面,我使用一些指标来确定它的值,例如电影=1.5677,极性为正。以后如何识别精度和召回率?
【问题讨论】:
标签: nlp nltk stanford-nlp sentiment-analysis
我已经计算了每个方面的一些值,并使用 sentiwordnet 确定了它的极性。
例如,这部电影很棒。这里的电影是一个方面,我使用一些指标来确定它的值,例如电影=1.5677,极性为正。以后如何识别精度和召回率?
【问题讨论】:
标签: nlp nltk stanford-nlp sentiment-analysis
由于您没有离散分类器,因此精确度将是您计算的分数与真实分数的接近程度(例如平方和误差或绝对误差之和会起作用)。如果你有一个离散分类器,你可以只计算正确分类的数量。
召回率是您能够成功提取的方面的百分比。因此,对于您的示例,您提取了唯一的方面,得分为1.0。如果输入是“披萨和电影很棒”,而您只提取了“电影”,那么您的召回分数将为0.5。
通常您可以将准确率和召回率分数组合成F-Measure,但由于您没有离散分类器,您可能无法使用F-Measure。
【讨论】:
(aspect, sentiment) 对,那么您可以将召回率计算为提取的方面的百分比。然后,您将获得两个精度分数:a) 提取的方面有多少百分比实际上是方面,b) 情感有多少百分比是正确的。
为了在 NLP 中评估您的模型,我们可以使用它:
1.评估方面提取模型:
TP: (真阳性) 正确提取的方面数 FP: (假阳性) 被注释但未被算法提取的方面的数量 FN: (假阴性) 未被注释但由算法提取的方面的数量 田纳西州: (真阴性) 算法未标注且未提取的方面数
2。评估情感分类模型:
TP: 算法正确计算的情感极性分数的数量 FP: 算法计算错误的情感极性分数的数量 不相关 FN: 未分配情感但由算法计算的方面的数量 TN: 未分配情感且未由算法计算的方面数
【讨论】: