【发布时间】:2020-03-13 17:10:04
【问题描述】:
我有 CSV 文件。 CSV 文件具有 user_id、Movie1、Movie2、Movie3、...、Movie250 列。 Please refer CSV file image for reference。每个用户对电影的评价不同。数据还包含许多 NA 值。我们不能省略 NA 值,否则我们将丢失可能有价值的数据。同时 NA 将不允许计算正确的平均评分。
我需要解决以下问题
- 哪些电影的观看次数/收视率最高?
- 每部电影的平均评分是多少?
- 定义收视率最高的前 5 部电影。定义观众最少的前 5 部电影。
【问题讨论】:
-
See here 提出一个人们可以帮助解决的 R 问题。这包括数据样本(不是图片)和所有必要的代码。还要记住minimal reproducible example 的minimal 部分。这似乎是一个家庭作业问题;你试过了吗?
标签: r