【问题标题】:Plot cluster analysis results in SAS在 SAS 中绘制聚类分析结果
【发布时间】:2020-12-15 13:34:12
【问题描述】:

PROC CLUSTER 的 SAS 文档中有一个示例,它对 Iris 数据集执行聚类分析:

proc cluster data=iris method=ward print=15 ccc pseudo;
   var petal: sepal:;
   copy species;
run;

proc tree noprint ncl=3 out=out;
   copy petal: sepal: species;
run;

从 PROC FREQ 我们可以看到有 16 个错误分类:

proc freq;
      tables cluster*species / nopercent norow nocol plot=none;
run;

如何获得变量的所有成对投影(总共 6 个)的图,其中集群成员由不同的颜色表示,并用单独的颜色或其他标记形状突出显示所有错误分类?

我知道可以使用 PROC SGPLOT 获得散点图,但我无法突出显示错误分类的观察结果。

【问题讨论】:

  • 你怎么知道不匹配?这有什么规则?我会添加一个新变量来指示变量是否不匹配,然后在我的 SGPLOT SCATTER 语句中使用 GROUP= 选项来突出显示这些记录。
  • @Reeza 好吧,sashelp.iris 已经有一个带有三个可能结果的列物种(总共 150 行,每个物种/集群 50 行)。这就是我们正在努力实现的目标 - 使结果尽可能接近物种列

标签: plot sas


【解决方案1】:

定义有些手动,但如果您认为每个分类的较低数量是错误的,您可以简化它。

data mismatched;
    set out;
    length mismatch $20.;

    if (cluster=3 and species='Versicolor') or (cluster=1 and species='Virginica') 
        then
            mismatch="Mismatched";
    else
        mismatch="Matched";
run;

proc sgplot data=mismatched;
    scatter x=petalLength y=petalWidth / group=mismatch;
run;

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2017-05-16
    • 2016-07-21
    • 2021-01-08
    • 2016-06-02
    • 1970-01-01
    • 2016-04-22
    相关资源
    最近更新 更多