【发布时间】:2014-12-10 19:58:04
【问题描述】:
我有一个包含分类(名义和有序)和数字属性的数据集。我想使用这些混合属性在我的观察中计算(不)相似度矩阵。使用R中cluster包的daisy()函数,我可以很容易地得到一个相异矩阵如下:
if(!require("cluster")) { install.packages("cluster"); require("cluster") }
data(flower)
as.matrix(daisy(flower, metric = "gower"))
这使用 gower 度量来处理名义变量。 R 中是否有与 daisy() 函数等效的 Python 函数?
或者可能是任何其他允许使用 Gower 度量或类似方法来计算具有混合(名义、数字)属性的数据集的 (dis)similarity 矩阵的任何其他模块函数?
【问题讨论】:
标签: python r similarity categorical-data r-daisy