【发布时间】:2017-05-29 23:35:09
【问题描述】:
我正在尝试在 R Studio 中为总平方和、平方和内以及平方和之间编写自己的函数,以实现我自己的 k-means。
我已经成功编写了平方和内的函数,但是我在平方和(以及 bss)方面遇到了困难。我得到的结果比 R 自己的 kmeans 函数计算的结果要大得多。我很困惑,因为我完全遵循公式提供的内容。这是我的数据:
A =
36 3
73 3
30 3
49 3
47 11
47 11
0 7
46 5
16 3
52 4
0 8
21 3
0 4
57 6
31 5
0 6
40 3
31 5
38 4
0 5
59 4
61 6
48 7
29 2
0 4
19 4
19 3
48 9
48 4
21 5
每一列都是一个特征。这是我迄今为止为 tss 创建的函数:
tot_sumoSq <- function(data){
avg = mean( as.matrix(data) )
r = matrix(avg, nrow(data), ncol(data))
tot_sumoSq = sum( (data - r)^2 )
}
我收到结果 24342.4,但 R 给出 13244.8。我完全错过了什么吗?
【问题讨论】: