【问题标题】:R - function to get a list of database columnsR - 获取数据库列列表的函数
【发布时间】:2016-12-25 08:08:21
【问题描述】:

我有一个包含多个变量的数据库,包括数字变量和分类变量。我想使用 R studio 仅对分类变量(频率、百分比)进行摘要描述性统计,我正在考虑使用函数创建的列列表隔离的数据库子集,然后将其传递给 sapply -> prop.table . 不幸的是,我被卡住了,我只能通过这些列来检测它们是否是分类的。

提前致谢, 安杰洛

【问题讨论】:

    标签: r function statistics summary categorical-data


    【解决方案1】:

    有很多方法可以遍历您的因子列。

    例如:

    d <- data.frame( A=numeric(), B=logical(), C=character() )
    for(col in which(sapply(d, is.factor)))
        print(col, names(d)[col], summary(d[,col]))  # print whatever statistics you want
    

    这是你想要的吗?

    【讨论】:

    • 非常感谢。我做了类似descriptive &lt;- function(dataset) { fattore&lt;- lapply(dataset,class) for (j in seq(dataset)) { if (!fattore[j]=="factor") { print(mean(dataset[,j], na.rm=T)) } else { print(table(dataset[j])) } } } 的事情,但我没有设法获得列标题...
    • 查看我的更新答案。要获取列名,请使用names(df)。然后,您可以对其进行索引以访问特定的列名,例如names(df)[1].
    猜你喜欢
    • 1970-01-01
    • 2015-04-03
    • 1970-01-01
    • 2010-10-10
    • 2013-10-16
    • 1970-01-01
    • 1970-01-01
    • 2010-12-21
    • 2020-05-21
    相关资源
    最近更新 更多