【发布时间】:2022-01-13 21:10:43
【问题描述】:
我觉得这个问题有一个简单的答案,因为这个论坛上有很多类似的问题,但由于某种原因似乎没有一个适用。
我有调查数据以及通过 excel 上传到 R 中的分段分配。我的数据结构基本上是这样的(大约 50 个字段,包括分段分配,针对 330 名受访者中的每一位):
| RespondentID | Household.Size | Children.in.household | Segment |
|---|---|---|---|
| 1 | 3 | Yes | Segment 1 |
| 2 | 2 | No | Segment 3 |
| 3 | 1 | No | Segment 2 |
| 4 | 2 | No | Segment 5 |
| 5 | 4 | Yes | Segment 1 |
正如您在上面看到的,有些变量是数字的,有些是分类的。我想创建一个简单的交叉表,不需要统计测试,它总结了每个段的每个字段。 IE。对于每个细分市场,该细分市场的受访者中有多少百分比的家庭规模为 1、2、3 等;家里有孩子的比例等。
我已经尝试过 CrossTable 和 crosstab(我意识到后者只是前者的包装),但我什么也做不了。论坛中发布的大多数解决方案都是针对单个字段的,如果可能的话,我希望避免为 50 个字段中的每一个生成单独的表格。
如果有解决此问题的简单方法,请告诉我!
【问题讨论】:
-
你能描述一下这会是什么样子吗?在我看来,它们自然应该是单独的表格,但也许我还没有看到您正在考虑的格式。
-
@JonSpring 我猜这个请求是为了自动生成 50 个表。
-
根据我们从承包商那里获得的交叉表,我相信您是正确的 - 每个字段都会有一个单独的表格。但是,我不希望为 50 个字段生成单独的表 - 即。有 50 行代码,每行都会生成一个表格——如果我不需要的话(尽管如果必须的话我会接受——我也不知道如何完成)。
-
@IRTFM 确切地说-我希望有一个函数可以基本上说“对于每个字段,生成一个汇总表,其中行是字段值,列是段,单元格包含对应于每个字段值的每个段的百分比"
-
查看
tbl_summary包中的gtsummary。