【问题标题】:Sentiment analysis python情绪分析python
【发布时间】:2014-12-11 05:32:35
【问题描述】:

我正在用 python 做我的大学项目。我是 python 新手。我得到了以下项目

构建一个分类器来预测餐厅评论是正面还是负面,仅基于 文本。使用来自 TripAdvisor 的评论。获胜的团队获得奖金。

现在在这个项目中,我已经从 Tripadvisor 提取了数据,但是有人可以帮我了解如何对它们进行分类吗?我在课堂上不太了解,所以有人可以告诉我一个很好的视频教程,我可以在其中学习这个分类

提前致谢 抢

【问题讨论】:

标签: python


【解决方案1】:

我看到以下步骤

  1. 从 TripAdvisor 获取数据
  2. 分析数据并提取餐厅名称,并对测试评论运行 NLTK 朴素贝叶斯分类。

这可以通过多种方式完成,我希望您是一个快速学习者,因为如果您不是经验丰富的编码器,这将非常困难。但是去获取scrapy,这将是您完成此类任务的首选工具。这很难,但 scrapy 有非常好的文档和教程。但如果您不是经验丰富的编码员,这将需要一些时间。

Scrapy 还可以帮助您处理数据 (html),您必须提取 resurant 的名称并在评论上运行 NLTK 朴素贝叶斯分类

最后但同样重要的是,您必须使用 scrapy 管道来保存数据。我会为你的项目推荐 sqlite..

如有需要,请随时提出问题,但要让它们发挥作用。我们不能为您完成您的项目。但我们当然可以帮助您朝着正确的方向前进,并帮助您解决一些编码问题。但是在询问之前最好先尝试一下,我们讨厌那些懒惰的人在询问之前不要自己尝试和研究;)

祝你的项目好运,欢迎来到 Stackoverflow。

【讨论】:

  • 感谢您的及时回复。我已经将数据(评论和评级)提取到一个文本文件中。现在我必须对数据进行分类。所以你建议我应该怎么走?
  • 我必须将数据分为正面和负面......所以我必须给出有多少正面评论和多少负面评论
  • 好的,在这种情况下不需要NLTK朴素贝叶斯分类你可以直接从html中提取数据
  • @user3930701,你有多少时间完成这个项目?网站的抓取也就是数据收集不是一项小任务。
  • 我已经提取了数据......我应该怎么做分类......对于用户我有 3 周的时间来完成这个项目......我的教授教过我 knn 分类,但我没有真的明白……所以我想从头开始做一些事情
猜你喜欢
  • 2022-11-20
  • 2015-02-11
  • 2013-02-02
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多