【发布时间】:2016-07-29 02:04:55
【问题描述】:
我正在尝试对 R 中“ggplot2”包附带的电影数据集进行聚类。我将使用 k-means。该数据集附带的列名是:
[1] "title" "year" "length" "budget" "rating"
[6] "votes" "r1" "r2" "r3" "r4"
[11] "r5" "r6" "r7" "r8" "r9"
[16] "r10" "mpaa" "Action" "Animation" "Comedy"
[21] "Drama" "Documentary" "Romance" "Short"
您认为根据电影类型进行聚类是个好主意吗?我有点迷茫,不知道从哪里开始。有什么建议吗?
【问题讨论】:
-
不清楚你想达到什么目的
-
我只是想引入一些想法,以便更多地了解集群是什么以及做什么。就像在这个数据集的例子中,你会怎么做来聚类它,你会有什么问题?
标签: r cluster-analysis data-mining k-means