【问题标题】:Summing two groups under the same Categorical variable将同一分类变量下的两组相加
【发布时间】:2020-12-18 19:47:45
【问题描述】:

我有一个名为“categories”的字符串变量,如下所示:

但是,如您所见,一些观察结果列在“类别 1”下,而其他观察结果列在“类别 1”下,但我基本上想将它们加在一起,类别 1 的总数为=(3686 + 36)= 3722.

categories|      Freq.     Percent        Cum.
------------+-----------------------------------
 Category 1 |      3,686       10.53       10.53
 category 1 |         36        0.10       10.63
category 10 |         54        0.15       10.79
category 11 |      1,122        3.21       13.99
 category 2 |        615        1.76       15.75
 category 3 |     15,333       43.80       59.55
 category 4 |     12,694       36.26       95.81
 category 5 |        234        0.67       96.48
 category 6 |        110        0.31       96.79
 category 7 |        983        2.81       99.60
 category 8 |         35        0.10       99.70
 category 9 |        105        0.30      100.00

【问题讨论】:

    标签: stata data-manipulation


    【解决方案1】:

    据此,我猜您的未命名变量是字符串,但分配不一致。

    replace whatever = lower(whatever) 
    

    将是将Category 1 映射到category 1 的几种方法之一。更好的合作方式

    gen betteryet = real(word(whatever, 2)) 
    

    因为category 的措辞没有帮助,如果您有类别 1 到 11,您不妨按此顺序查看它们。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-11-15
      • 1970-01-01
      • 2022-01-18
      • 2016-12-13
      • 2022-01-14
      相关资源
      最近更新 更多