【发布时间】:2014-07-08 20:11:52
【问题描述】:
我在 R 中使用 randomForest 包,它允许计算邻近矩阵 (P)。在包的描述中,它将参数描述为:“如果调用 randomForest 时接近度 = TRUE,则输入之间的接近度度量矩阵(基于数据点对在相同终端节点中的频率) .”
我得到一个随机森林的邻近矩阵如下:
P <- randomForest(x, y, ntree = 1000, proximity=TRUE)$proximity
当我研究 P 矩阵时,我看到 P(i,j)=0.971014493 这样的值,其中 i 和 j 是我的训练数据集 (x) 中的两个数据实例。这样的值没有意义,因为当它乘以 1000(森林中的树木数量)时,得到的数字不是整数,因此是“频率”。有人可以帮我理解,为什么我会在邻近矩阵中得到这样的实数?
【问题讨论】:
标签: r statistics random-forest proximity