【问题标题】:Problems in Unsupervised Aspect Based Sentiment Analysis基于无监督方面的情感分析中的问题
【发布时间】:2020-04-30 22:31:18
【问题描述】:

我正在研究基于无监督方面的情感分析。我尝试使用 Vader,这给了我很好的结果,但问题是如果主题是负面的,比如“食物浪费”,那么即使内容说“我真的很讨厌食物浪费”,情绪总是会变得消极。 有人可以帮助我解决这个问题,或者甚至建议我比维德更好的方法。 我也尝试过使用“Flair”,但结果不如 Vader。

【问题讨论】:

  • 你能把vader为这句话输出的所有分数贴出来吗?您使用的是 python 模块还是其他一些实现?有时,复合乐谱可以洞察更复杂的短语。
  • @m.rp 结果为 {'neg': 0.702, 'neu': 0.298, 'pos': 0.0, 'compound': -0.7939}

标签: machine-learning nlp sentiment-analysis unsupervised-learning vader


【解决方案1】:

在这种情况下,VADER 使用的基于规则的模型可能不是一个好方法,在那个短语中,您有 3 个单词肯定会得到负分(讨厌食物浪费),请记住 VADER 已针对简洁的社交媒体数据进行了优化并且不能很好地掌握短语的“上下文”。

我们在 TextBlob 中使用了与 VADER 类似的方法,您无需做太多工作即可尝试:https://textblob.readthedocs.io/en/dev/

通常有监督的路线会提供更好的结果,但您需要一个好的预训练模型和好的数据。

scikit-learn 中的朴素贝叶斯分类器: https://www.datacamp.com/community/tutorials/simplifying-sentiment-analysis-python

随机森林方法,总是使用 scikit-learn: https://stackabuse.com/python-for-nlp-sentiment-analysis-with-scikit-learn/

以下是对情绪分析的各种方法的回顾: https://towardsdatascience.com/fine-grained-sentiment-analysis-in-python-part-1-2697bb111ed4

【讨论】:

  • 但是我的数据没有被标记..所以我必须使用无监督的方法
  • 这只是为了说明您有哪些选择,如果您想尝试与 VAEDER 类似的方法,请尝试 TextBlob textblob.readthedocs.io/en/dev
猜你喜欢
  • 2020-07-31
  • 2011-04-24
  • 2017-06-29
  • 2016-01-16
  • 1970-01-01
  • 2019-05-17
  • 2023-04-04
  • 2011-08-10
  • 1970-01-01
相关资源
最近更新 更多