豆瓣电影短评:Scrapy 爬虫+数据清理/分析+构建中文文本情感分析模型

向AI转型的程序员都关注了这个号????????????

机器学习AI算法工程   公众号:datayx

项目——豆瓣电影Top250的短评分析

Scrapy 爬虫 + 数据清理 + 数据分析 + 构建情感分析模型

  • 一、爬取豆瓣Top250的短评数据

    • movie_item

    • movie_comment

    • movie_people

  • 二、数据清理与特征工程+统计分析

    • 就肖申克的救赎这个电影而言

    • 全部影片的短评数据分析

    • 短评词云

    • 用朴素贝叶斯完成中文文本分类器

    • 用svc完成中文文本分类器

    • 用facebook-fasttext有监督完成中文文本分类

    • 用facebook-fasttext无监督学习

    • 用cnn做中文文本分类

    • 用rnn做中文文本分类

    • 用gru来完成中文文本分类

    • 总评分最高的前10部电影

    • 最受欢迎的电影类别排名

    • 最受欢迎的电影出品国家排名

    • 最受欢迎的电影导演排名

    • 最受欢迎的电影演员排名

    • 最受欢迎的电影语言排名

    • 根据电影时长的电影排名

    • 根据电影投票数的电影排名

    • 根据电影评价数的电影排名

    • 根据电影提问数的电影排名

    • 根据电影发布时间的规律

    • 1~5星级投票的百分比

    • 电影简介的情感分析

    • movie_item

    • movie_comment

    • movie_people

  1. 短评人常居地按照国家分布

  2. 中国短评人常居地按照省份分布

  3. 每个短评人的被关注数与好友数

  4. 中国短评人的被关注数和好友数的人均地域分布

  5. 根据点评人个人简介构建中文文本分类模型

相关文章:

  • 2021-12-14
  • 2022-01-02
  • 2021-06-12
  • 2021-07-14
  • 2022-02-07
  • 2022-01-11
  • 2021-06-16
猜你喜欢
  • 2021-11-21
  • 2021-04-05
  • 2022-02-08
  • 2022-12-23
  • 2021-07-03
  • 2021-11-21
相关资源
相似解决方案