【发布时间】:2020-12-15 13:34:12
【问题描述】:
PROC CLUSTER 的 SAS 文档中有一个示例,它对 Iris 数据集执行聚类分析:
proc cluster data=iris method=ward print=15 ccc pseudo;
var petal: sepal:;
copy species;
run;
proc tree noprint ncl=3 out=out;
copy petal: sepal: species;
run;
从 PROC FREQ 我们可以看到有 16 个错误分类:
proc freq;
tables cluster*species / nopercent norow nocol plot=none;
run;
如何获得变量的所有成对投影(总共 6 个)的图,其中集群成员由不同的颜色表示,并用单独的颜色或其他标记形状突出显示所有错误分类?
我知道可以使用 PROC SGPLOT 获得散点图,但我无法突出显示错误分类的观察结果。
【问题讨论】:
-
你怎么知道不匹配?这有什么规则?我会添加一个新变量来指示变量是否不匹配,然后在我的 SGPLOT SCATTER 语句中使用 GROUP= 选项来突出显示这些记录。
-
@Reeza 好吧,sashelp.iris 已经有一个带有三个可能结果的列物种(总共 150 行,每个物种/集群 50 行)。这就是我们正在努力实现的目标 - 使结果尽可能接近物种列