【发布时间】:2021-08-11 23:47:04
【问题描述】:
我有一个格式如下的数据框:
Person Answer Value
John Yes 3
Pete No 6
Joan Yes 5
Joan Yes 4
Pete No 7
我想进行分析(并创建堆积条形图),我可以在其中按 Person(重复)和 Answer 变量分组,然后按值进行汇总。
我尝试使用 dplyr 来执行此操作,但遇到了问题。如果我在 dplyr 管道中使用 group_by 子句,我尝试执行该功能的值会受到阻碍。
例如,
df2 <- df %>%
select(Person, Answer, Value) %>%
group_by(Person, Answer) %>%
summarise(sum(value = 3)/length(original dataframe ungrouped) + sum(value = 6)/length(original dataframe ungrouped)
我遇到的问题是正确执行此计算。数据分组后计算没有意义,因为分组后我最终返回了一个非常有限的数据帧。
预期输出:
person answer value
Joan Yes. calculated value (summary stat)
Joan No. calculate value
John Yes. calculated value....
John No
Pete Yes
Pete No
最后,我想制作一个堆积条形图,其中汇总显示在人员中,条形按“是”和“否”答案划分为百分比。例如,有 3 个小节:1 个代表 John,1 个代表 Pete,1 个代表 Joan,每个小节分为两部分(基于是/否响应的值)
谢谢!
【问题讨论】:
-
请同时显示您的预期输出。什么是'var1'、'var2'、'var3'
-
好像和上一个问题有关:stackoverflow.com/questions/68747743/…我们需要更多关于上下文的解释。
-
看你之前的问题(stackoverflow.com/questions/68747743/…)我可以看到crestor,akrun和TarJae都在努力帮助你天真。我认为您应该花一些时间学习 how to create a good question 并提供更多详细信息以帮助我们帮助您(并避免浪费我们的时间),这似乎是公平的
-
您可以使用
==在 R 中获取逻辑值。您只能使用=进行分配。 -
我试图提供更多细节。将来,我一定会提供更好的示例。感谢所有帮助。
标签: r function dplyr stacked-chart