【发布时间】:2019-03-21 19:46:58
【问题描述】:
我最近完成了一个机器学习课程,想制作一个论坛情绪分析工具,将其应用于股票相关的论坛。
这个想法是:
- 使用他们的 cmets 捕获(文本挖掘)用户,并评估他们的评论情绪(正面、负面、中立)。
- 捕捉这些 cmet 之后发生的事情(股市),并相应地为用户分配权重(如果用户的情绪是准确的并且市场遵循相同的方向,则权重更大)
- 使用 cmets 作为预测市场方向的工具。
实际上,我自己做这件事(关注论坛),加上我自己的技术分析和义务尽职调查,这对我来说效果很好。我只是想尝试将其自动化一点,甚至可能允许程序使用我的一些账户(首先进行模拟交易,如果它表现得体,则在真实账户中分配一些钱)
这将是我的第一个机器学习项目(仅作为概念验证),因此非常感谢任何 cmets。
我发现最大的问题是我想做一个无监督训练,我需要一个样本数据集来进行训练。
问题:是否有任何已知的论坛情绪数据集可用于无监督训练?
我找到了几个情绪数据集(twitter、imbd、amazon 评论),但它们非常特定于他们的利基(短信、电影、产品......),但我正在寻找更通用的东西。
【问题讨论】:
标签: sentiment-analysis unsupervised-learning