【问题标题】:How to convert `proportion var1, over(var2)` in Stata to R如何将Stata中的“比例var1,over(var2)”转换为R
【发布时间】:2020-08-20 15:23:53
【问题描述】:

我通常在Stata中使用命令proportion var1, over(var2)来获取var1被var2分层的比例。

我想知道如何在R 中做到这一点?

状态输出:

. prop CS_RACA2, over(SEM_PRI_CAT2 )



Proportion estimation             Number of obs   =      6,613



       Branca: CS_RACA2 = Branca

        Preta: CS_RACA2 = Preta

        Parda: CS_RACA2 = Parda

     Ignorado: CS_RACA2 = Ignorado

      _prop_5: CS_RACA2 = Amarela/Indigena



    _subpop_1: SEM_PRI_CAT2 = 1 a 16

    _subpop_2: SEM_PRI_CAT2 = 17 a 21

    _subpop_3: SEM_PRI_CAT2 = 22 a 25

    _subpop_4: SEM_PRI_CAT2 = 26 a 29



--------------------------------------------------------------

        Over | Proportion   Std. Err.     [95% Conf. Interval]

-------------+------------------------------------------------

Branca       |

   _subpop_1 |   .3179625   .0107862      .2972029    .3394717

   _subpop_2 |   .3071672   .0120568      .2840509    .3312943

   _subpop_3 |   .2307692   .0095756      .2125342     .250072

   _subpop_4 |   .2340267   .0115446       .212159    .2574121

-------------+------------------------------------------------

Preta        |

   _subpop_1 |   .0825737    .006375      .0709064    .0959625

   _subpop_2 |   .0798635   .0070848       .067032    .0949014

   _subpop_3 |   .1104801   .0071247      .0972671    .1252391

   _subpop_4 |   .0676077    .006846       .055361    .0823276

-------------+------------------------------------------------

Parda        |

   _subpop_1 |   .4541555   .0115322      .4316582    .4768415

   _subpop_2 |   .4627986   .0130315      .4373723      .48842

   _subpop_3 |   .4889004   .0113608      .4666662    .5111786

   _subpop_4 |   .4940565   .0136326      .4673746    .5207723

-------------+------------------------------------------------

Ignorado     |

   _subpop_1 |   .1383378   .0079968      .1233938    .1547721

   _subpop_2 |   .1392491   .0090482      .1224397    .1579509

   _subpop_3 |   .1641714   .0084189      .1483267    .1813482

   _subpop_4 |   .1953938   .0108115      .1750653    .2174605

-------------+------------------------------------------------

_prop_5      |

   _subpop_1 |   .0069705    .001927      .0040507    .0119698

   _subpop_2 |   .0109215   .0027164      .0066996    .0177564

   _subpop_3 |   .0056789   .0017078      .0031468    .0102274

   _subpop_4 |   .0089153   .0025631      .0050683    .0156366

--------------------------------------------------------------

【问题讨论】:

  • 可能是prop.table(xtabs(~ var2 + var1))?您可以发布示例数据和预期输出吗?请使用dput(df) 的输出编辑问题。或者,如果 dput(head(df, 20)) 的输出太大。 (df 是您的数据集的名称。)
  • 如何获取STATA中Std. Err.[95% Conf. Interval]的值?也许应该分开?
  • 您是否要求按 var2 分组的 var1 的百分比?你可以用dplyr(一个标准的数据包装r包)动词来做到这一点。
  • 如果您提供几行示例数据以及问题中所需输出的完整描述,将会很有帮助。
  • 一些 R 包计算 95 CI,“PropCIs”就是其中之一

标签: r stata


【解决方案1】:

我想这就是你要找的东西:

library(dplyr)

df %>%
   group_by(var2) %>%
   mutate(prop = var1 / sum(var2))

编辑:%>%inserted

【讨论】:

  • 这种方法给了我比例,但此外,命令prop var1, over (var2) 给了我置信区间。很抱歉,我无法告诉您它是如何计算的,但此命令会显示这些值。
  • 您可以使用binom.test 获取置信区间,也可以使用broom 包将其清理为更好的输出。
  • proportion 在 Stata 中所做的事情已记录在案,R 用户也可以阅读。 stata.com/manuals/rproportion.pdf 同时,一个很好的问题会解释默认方法,不要指望 R 人会做找到它的工作。
猜你喜欢
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
  • 2011-04-02
  • 2023-03-14
  • 1970-01-01
  • 1970-01-01
  • 2015-06-17
相关资源
最近更新 更多