【发布时间】:2018-10-27 16:00:07
【问题描述】:
DATA = data.table(col1 = rbinom(10,10,.5),
col2 = rnorm(10),
col3 = rbinom(10,1,.5),
col4 = rbinom(10,10,.5),
col5 = rbinom(10,1,.5))
我有一个大型数据集,其中连续变量属于integer 或numeric 类,分类变量属于integer 类。因此,我正在寻找其他规则来区分连续变量和分类变量。如表中所示,所有分类变量均为0-1。
由于数据集很大,我更喜欢使用data.table 包。
【问题讨论】:
-
您预期的 otuput 是什么意思?只是为了让人类进一步探索数据或自动处理需要准确的分类变量名称?
-
它是针对自动处理的。
-
请将预期结果添加到您的问题中(例如,您是否希望有两个带有列名的向量)以帮助我们给出准确的答案。 THX :-)
标签: r data.table