【发布时间】:2021-06-25 01:16:27
【问题描述】:
这可能更像是一个理论问题而不是编码问题。
我正在尝试编写一个闪亮的应用程序,它将遍历数据框的连续数字列并对这些列执行测试。该应用程序允许用户上传自己的数据框,所以我不知道它会提前是什么样子。我知道我可以使用 dplyr 包通过以下方式仅选择数字列
library(dplyr)
data <- data %>%
select(where(is.numeric))
这可行,但离散的数字列也会保留。我想不出一个只选择连续列的好方法。
我曾想过尝试做一些事情,比如只选择模式重复次数小于数据帧长度的某个比例的列。或者可能像唯一值的数量需要大于模式重复的次数。但这些似乎都不能很好地概括。而且他们也不会摆脱 id 列。
感谢任何想法,谢谢。
【问题讨论】:
-
如果离散变量编码为整数或因子,如果您询问
is.double,您将返回 FALSE
标签: r selection continuous