R数据子集重组[关闭]

【问题标题】：R data subset restructuring [closed]R数据子集重组[关闭]
【发布时间】：2014-11-16 01:38:27
【问题描述】：

我对 R/Rstudio 还很陌生，我仍在学习如何进行某些操作。我有以下数据集。对于列，我有经营区域、元素类型（CA、OBU）、子元素和净收入。目前数据非常大（50 000 行），我想按元素、子元素和 NR 获取操作区域的摘要。示例

 Operating Region   Element Sub-Element NR
 Asia        CA     CA123   50 000
 America    OBU     EFK456  35 000

有人可以指导我如何做到这一点吗？任何相关的阅读材料/示例将不胜感激。

【问题讨论】：

你想要Operating, Region, Element, Sub-Element对NR的汇总统计吗？
或使用library(doBy); summaryBy

标签： r dataframe subset plyr apply

【解决方案1】：

使用下面的数据返回数据框对象“数据”，您可以使用dplyr 包以多种不同方式组织结果。这是一个例子：

data <- data.frame("OperatingRegion" = c("Asia", "America"), "Region" = c("CA", "OBU"), "Element" = c("CA123", "EFK456"), "SubElement" = c(50000, 35000))

require(dplyr)
results <- data %.%
  group_by(OperatingRegion) %.%
  summarise(SubE = sum(SubElement, na.rm = TRUE))

Source: local data frame [2 x 2]

  OperatingRegion  SubE
1         America 35000
2            Asia 50000

加载包后，您提供 dplyr 数据框，然后使用特殊运算符 %.% 或 %>%，group_by 任何您想要的单个或多个变量。然后，调用summarise 来创建总和、中位数、平均值或任何您想要的计算。

【讨论】：