【问题标题】:Calculate correlation distribution of two columns in percentage以百分比计算两列的相关分布
【发布时间】:2018-07-17 23:10:51
【问题描述】:

我正在处理具有多个数据列的数据集。

在此数据集中,我计算了两列中 2 的分位数,并将分位数的结果转换为 2 个新列,其中每个单元格显示属于的四分位数的数量。

现在我想了解这 2 列之间的分布关系。 我的意思是,例如,当第 1 列的结果为 4 时,与第 2 列的结果有什么关系?

例如:

当第 1 列中的结果为 4 = 1 的 30%、2 的 20%、3 的 40%、第 2 列中 4 的 10% 时

当结果是 1,2,3 时也一样...

也许我正在寻找的东西在统计数据中有一个名称,但不确定是什么。

有人可以帮忙吗?

非常感谢。

【问题讨论】:

    标签: r statistics relationship percentage


    【解决方案1】:
    library(tidyverse)
    
    data <- mtcars %>% 
       select(vs, gear) # the similar dataset 
    
    data %>% 
        group_by(vs, gear) %>% 
        summarise(n = n()) %>% 
        ungroup() %>%
        group_by(vs) %>% 
        mutate(perc = n/sum(n))
    

    【讨论】:

    • 虽然此代码可能会回答问题,但提供有关此代码为何和/或如何回答问题的额外上下文可提高其长期价值。
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 2020-09-07
    • 1970-01-01
    • 2023-03-09
    • 2022-12-05
    • 1970-01-01
    • 1970-01-01
    • 2016-07-19
    相关资源
    最近更新 更多