【发布时间】:2015-08-23 11:04:52
【问题描述】:
如果一个数据集有混合变量:数值型和分类型,除了summary(dataset)之外,有没有办法总结它,其中每个类别的计数包含在分类变量和平均值中,sd包含在数值中变量?
当前我编写了一个代码 sn-p 在检查每一列是数字还是分类后生成一个列表。但是更简单的功能会很有用。
例如 data.frame(v1 = c(1:3),v2= c("a","b","b")),其中所需的输出是:
V1,类型(num/cat),均值(v1),sd(v1) V2, type(num/cat), a, count(a), b, count(b)
【问题讨论】:
-
尝试
dplyr即library(dplyr);df1 %>% summarise_each(funs(class, mean, sd))要获得count,我猜你需要table(df1$v2)
标签: r summary categorical-data