reshape2

R:将描述性列和相关值组合成矩阵形式

我有一个冗长的操作数据集 (op#) 和时间 {tm#) 与各种小部件相关联。不幸的是,这些操作没有特定的顺序,因此绘制操作可能发生在第一个操作或第 80 个操作中。每个操作在右侧的列中都有完成该操作所需的相关时间。我想组织数据,使每一列都是唯一的操作名称,列中的值是完成该操作所需的相关时间。 # sample data frame df = data.frame(widget = c("wid... »

加快 acast() 调用以创建矩阵

我正在使用 Hadley 的 reshape2 包中的 acast 函数将扁平数据集(从 SQL Server 查询)转换为术语文档矩阵,如下所示: ## Load packages require("reshape2") require("plyr") require("RODBC") require("lsa") ## Get flattened term-frequency data: ... »

R SparkR - 相当于熔化功能

SparkR 库中是否有类似melt 的函数? 将 1 行 50 列的数据转换为 50 行 3 列的数据? @sramalingam24 这根本... »

reshape2:聚合函数的多个结果?

根据我的阅读,reshape2 中的 *cast 操作失去了 result_variable 功能。 Hadley 暗示为此目的使用 plyr(将多个结果列附加到输入数据帧)。我将如何实现文档示例... aqm <- melt(airquality, id=c("month", "day"), na.rm=TRUE) cast(aqm, month ~ variable + result_... »

在R中将许多变量从长转换为宽[重复]

我希望在 R 中将许多变量从长转换为宽。我已经将家庭数据聚类为一个聚类,并且在每个家庭个体中进行聚类。对于每一个单独的几个测量变量,每个测量不止一次。在下面的示例中,您可以看到两个变量 x 和 y,每个变量测量两次。 我知道如何对一个变量执行此操作,使用 reshape2 包和 dcast 函数,但它不适用于多个变量。 我附上了一张示例数据的图片和生成它的代码。 family = c(1,1... »

透视没有键值对的表[重复]

我有一个格式为的数据框 table_name <- c("city", "city", "city", "car", "car", "country", "country", "country", "country", "country") column <- c("Vienna", "Paris", "London", "Honda", "Nissan", "Germany", "... »

R:在 reshape2 中排序行

我有一种情况需要使用 R 中的 reshape2 包融化数据。 melt(head(faithful), measure.vars = names(faithful)) 这给出了输出: variable value 1 eruptions 3.600 2 eruptions 1.800 ... 7 waiting 79.000 8 waiting 54.000... »

从宽到长:多列、两个时间点、两组

我已经搜索并找到了一些示例,到目前为止我还没有能够解决将我的数据从宽转换为长的问题。 以下是数据示例: set.seed(12345) id = 1:100 age = sample(1:100, 100, replace=TRUE) group = sample(1:2, 100, replace=TRUE) t0_var1 = sample(1:300, 100, replace=TRUE) ... »

重组具有多种数据类型的大型数据框[重复]

我正在努力使我的数据(xlsx 文件)具有正确的形状。我原来的数据库如下: patient when age weight height watchID dateFrom <chr> <chr> <dbl> <dbl> <dbl> <dbl> <dttm> ... »

R:如何将“变量”的子集转换为 data.table 中的单独列?

我在 data table 中有一个大数据集,我正在尝试对其进行转换。原始数据集是一个交叉表,column_names 中有 1 到 2 级信息。所以我想我需要把所有东西都写下来melt,提取相关信息,然后将各个列重新投射回去。 这是我遇到障碍的地方。 下面是一个简化的模拟数据,显示了我正在尝试做的事情: 从: ID1 ID2 X.Measure1 X.Measure2 Y.Mea... »

使用嵌入的列和年份名称进行整形

您好,我有一个数据,其中年份值嵌入在列名中,如下所示,我想将其重塑为长格式。 state<- c('MN', 'PA', 'NY') city<- c('Minessota', 'Pittsburgh','Newyork') POPEST2010<- c(2899, 344,4555) POPEST2011<- c(4444, 348,8999) POPEST2012... »

如何将具有多列的数据框从宽转换为长[重复]

我有一个这样的数据框,它是使用“reshape”函数生成的。我想知道 reshape 函数是否有一个“相反”功能,它允许我根据多列将数据框从宽变为长? 我有这个: ID Date.1 Site.1 Brand.1 Date.2 Site.2 Brand.2 A-001 2021-05-21 Place A Brand A 2021-06... »

更快的计算频率和从长到宽投射的方法

我正在尝试获取两个变量“week”和“id”的每个级别组合的计数。我希望结果将“id”作为行,将“week”作为列,并将计数作为值。 到目前为止我尝试过的示例(尝试了很多其他方法,包括添加一个虚拟变量 = 1,然后在上面添加 fun.aggregate = sum): library(plyr) ddply(data, .(id), dcast, id ~ week, value_var = ... »

具有写入 3 个单独列 R 或 dplyr/reshape 解决方案的函数的 for 循环?

我是 for 循环的初学者,所以如果这个问题已经有了明确的答案,我深表歉意,但我找不到任何我理解如何应用于这个特定问题的东西。最后我也开始尝试 dplyr 实现,但也无法弄清楚。 这是我的问题:有一个函数可以从向量中导出 3 个值。我想将这 3 个值写入与新列相同的 df 。该函数是来自 R 中 retimes 库的 timefit。 如果我在整个 df 上运行它: a1 <- t... »

如何在 VS 代码中安装 R 包

我已经在 vscode 中安装了 R 及其所有扩展。 我尝试通过 vscode 终端安装软件包。但是在成功安装后运行代码时它说没有名为“reshape2”的软件包(我使用library("reshape2"))来导入库。 ... »

为data.frame中的多个变量按组计算平均值和标准差

编辑 -- 这个问题最初的标题是> 我只是在学习 R,并试图找到应用它来帮助我生活中的其他人的方法。作为一个测试用例,我正在努力重塑一些数据,但我无法按照我在网上找到的示例进行操作。我开始的内容如下所示: ID Obs 1 Obs 2 Obs 3 1 43 48 37 1 27 29 22 1 36 32 40... »

按组将数据框转换为部分“宽”和部分摘要

我有以下数据框 id datestamp hrofday val1 val2 val3 a 20120401 0 3.2 0 1 a 20120401 1 3.3 4 0 a 20120401 2 3.4 6 0 ... a 20120401 23 7.3 0 2 它代表一个用户ID,后跟一天中的小时,val1 val2 & val3。 我想使用 cast 使用 reshape 或 ... »

dcast从宽到长[重复]

这应该很容易,但我找不到正确的方法。 jk <- data.frame(j=c("a","b","a","b"),val=c(1,3,2,1)) 我希望 dcast 分别返回带有 {1,2} 和 {3,1} 的两列 a 和 b。... »

不能在 data.table setkey 的反引号列名中使用逗号?

如果我有一个需要反引号的列名,因为它包含逗号,setkey 会抛出一个错误,提示不要使用逗号。该错误将我引向?setkey,但我在示例中没有看到任何提及这一点的内容。我能找到的唯一解决方法是重命名列setkey,然后重命名。 示例代码: library(data.table) > DT = data.table(`X, in $` = rnorm(10)) > DT ... »

在 R:函数中的 dcast 中,传递列名(再次!)

给定一个半长格式的 df,其中 id 变量为 a 和 b,测量数据列在 m1 和 m2 中。数据类型由变量v(值var1 和var2)指定。 set.seed(8) df_l <- data.frame( a = rep(sample(LETTERS,5),2), b = rep(sample(letters,5),2), v = c(rep("var1"... »