【问题标题】:Sentiment Analysis for local languages (Nepali)当地语言的情绪分析(尼泊尔语)
【发布时间】:2016-11-06 22:44:15
【问题描述】:

我想在文档级别进行情绪分析。但我正在尝试做尼泊尔语的情绪分析。所以,我没有任何资源。我不能做朴素贝叶斯分类器,因为我没有任何标记数据,也不能做 vai wordnet,因为不存在尼泊尔语 wordnet。我阅读的论文通常带有其他语言的标记数据或 senti-wordnet。

我想知道这些事情:

  • 在上述情况下,我应该使用哪种方法进行情绪分析?
  • 我有什么方法可以为数据动态生成标签吗?

【问题讨论】:

  • 情感分类任务中最重要的成分之一是数据。我不知道在哪里可以获得尼泊尔标记的数据,但你应该努力找到它。稍后当您获得数据时,方法基本相同,无论如何您都将您的特征(单词)转换为整数,所以没关系。只需找到训练集。

标签: localization nlp sentiment-analysis naivebayes senti-wordnet


【解决方案1】:

由于您没有任何标记数据,请查看this GitHub Repo,随时 fork。

它具有用于 Java 手写识别的神经网络代码。 Jeff Heaton 为我们做的很简单,通过一个漂亮的 UI,你可以训练这个模型来识别尼泊尔语。

对于情绪分析,你可以尝试使用Opennlp,它有一些很好的支持, this blog for Beginner's

另外,DL4J 是一个很好的 Java 深度学习库,可用于情感分析。它有一个很好的 Word2Vector 实现并且有很多支持。

这些资源将为您提供帮助,如有任何疑问,请随时发表评论。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2021-01-25
    • 1970-01-01
    • 1970-01-01
    • 2015-04-14
    • 1970-01-01
    • 1970-01-01
    • 2015-05-07
    相关资源
    最近更新 更多