【发布时间】:2012-11-16 18:26:03
【问题描述】:
我正在编写一个函数,该函数使用 kmeans 来确定 bin 宽度以将连续测量(预测概率)转换为整数(3 个 bin 之一)。我偶然发现了一个边缘情况,在这种情况下,我的算法有可能(正确地)预测整个集合的相同概率,我想处理这种情况。我正在通过以下方式使用rattle 包的binning() 函数:
btsKmeansBin <- function(x, k = 3, default = c(0, 0.3, 0.5, 1)) {
result <- binning(x, bins = k, method = "kmeans", ordered = T)
bins <- attr(result, "breaks")
attr(bins, "names") <- NULL
bins <- bins[order(bins)]
bins[1] <- 0
bins[length(bins)] <- 1
return(bins)
}
在x <- c(.5,.5,.5,.5,.5,.5) 上运行此函数,您将在order(bins) 步骤中收到错误,因为bins 将为NULL,因此不是向量。
显然,如果x 只有一个不同的值,kmeans 不应该工作。在这种情况下,我想返回 default bin 分区。发生这种情况时,binning 会发出“警告:不考虑变量”。所以我想使用tryCatch 来处理这个警告,但是用下面的代码包围result <- ... 行并不能像我期望的那样工作:
...
tryCatch({
result <- binning(x, bins = k, method = "kmeans", ordered = T)
}, warning = function(w) {
warn(sprintf("%s. Using default values", w))
return(default)
}, error = function(e) {
stop(e)
})
...
警告被打印出来,就好像我没有使用过tryCatch 一样,并且代码经过return 语句并再次从order 抛出错误。我尝试了很多变体都无济于事。我在这里错过了什么??
【问题讨论】: