【发布时间】:2020-10-22 11:09:27
【问题描述】:
我创建了一个包含 30,000 个标题的语料库。我想使用高级监督机器学习(深度学习)方法(例如 RNN、LSTM 或 DNN)来预测这些头条新闻的情绪。
我的问题是:是否可以使用任何标记数据集(例如 IMDB 电影评论、亚马逊评论或 yelp 评论)来训练和测试深度学习模型。 例如,假设我们使用 RNN 训练和测试 IMDB 电影评论数据集,得到 92% 的 f1 分数。
那么,我可以输入我的未标记数据集(30,000 个标题)并使用这个经过训练和测试的模型预测他们的情绪吗?
问这个问题的原因是我发现很多博客和教程的代码都使用深度学习方法进行情感分析。他们使用标签数据集并训练和测试模型并缩短 ....accuracy 或 f1 分数。没有人走得更远,输入未标记的数据并用他们的模型“预测”情绪。这就是为什么我想知道这是否可能。
感谢您的建议和建议。
【问题讨论】:
-
不是堆栈溢出问题,因为没有代码。不过,要回答你的问题,这取决于。如果您的头条新闻也是 imdb 电影评论,那么可以。如果您的标题是商业电子邮件标题,那么不是。在特定领域训练的模型在大多数情况下仅适用于该领域。进一步概括它是可能的,但通常需要大量的工作/数据。
标签: python deep-learning neural-network sentiment-analysis