【问题标题】:R data subset restructuring [closed]R数据子集重组[关闭]
【发布时间】:2014-11-16 01:38:27
【问题描述】:

我对 R/Rstudio 还很陌生,我仍在学习如何进行某些操作。 我有以下数据集。对于列,我有经营区域、元素类型(CA、OBU)、子元素和净收入。 目前数据非常大(50 000 行),我想按元素、子元素和 NR 获取操作区域的摘要。 示例

 Operating Region   Element Sub-Element NR
 Asia        CA     CA123   50 000
 America    OBU     EFK456  35 000

有人可以指导我如何做到这一点吗? 任何相关的阅读材料/示例将不胜感激。

【问题讨论】:

  • 你想要Operating, Region, Element, Sub-ElementNR的汇总统计吗?
  • 或使用library(doBy); summaryBy

标签: r dataframe subset plyr apply


【解决方案1】:

使用下面的数据返回数据框对象“数据”,您可以使用dplyr 包以多种不同方式组织结果。这是一个例子:

data <- data.frame("OperatingRegion" = c("Asia", "America"), "Region" = c("CA", "OBU"), "Element" = c("CA123", "EFK456"), "SubElement" = c(50000, 35000))

require(dplyr)
results <- data %.%
  group_by(OperatingRegion) %.%
  summarise(SubE = sum(SubElement, na.rm = TRUE))

Source: local data frame [2 x 2]

  OperatingRegion  SubE
1         America 35000
2            Asia 50000

加载包后,您提供 dplyr 数据框,然后使用特殊运算符 %.% 或 %>%,group_by 任何您想要的单个或多个变量。然后,调用summarise 来创建总和、中位数、平均值或任何您想要的计算。

【讨论】:

    猜你喜欢
    • 2015-11-02
    • 1970-01-01
    • 2021-11-20
    • 1970-01-01
    • 1970-01-01
    • 2017-07-11
    • 2018-06-13
    • 1970-01-01
    • 2016-07-20
    相关资源
    最近更新 更多