【问题标题】:Review data sentiment analysis, focusing on extracting negative sentiment?回顾数据情绪分析,重点提取负面情绪?
【发布时间】:2015-12-08 02:33:02
【问题描述】:
我正在尝试对评论数据集进行情感分析。由于我更关心在评论中识别(提取)负面情绪(现在未标记,但我尝试手动标记数百个或使用 Alchemy API),如果评论总体上是中性或正面但部分有负面情绪,我想我的模型更倾向于将其视为负面评论。有人可以就如何做到这一点给我建议吗?我正在考虑使用带有监督(随机森林,SVM)/无监督学习模型(Kmeans)的词袋/word2vect。
【问题讨论】:
标签:
python
machine-learning
nlp
sentiment-analysis
【解决方案1】:
注释情绪时,不要注释“正面”、“负面”和“中性”。相反,将它们注释为“有负数”或“没有负数”。那么您的情绪分类将只关注特征指示负面情绪的强度,这似乎是您想要的。
【解决方案2】:
通过使用词袋法,您可以赋予负面词更多的权重。默认为 -1 表示否定词,+1 表示肯定词。
library(qdap)
Dict <- key.pol
Dict$y <- ifelse(Dict$y==-1,-3,Dict$y)
# explore on small chat
polarity("Food is good i like it. The delivery is bad",polarity.frame = Dict)$all
尽管有两个积极的词,但这里是消极的。