具有聚集标准误差的固定效应回归答案

【问题标题】：Fixed effect regression with clustered standard errors具有聚集标准误差的固定效应回归
【发布时间】：2021-12-25 10:51:37
【问题描述】：

我目前正在研究 r 中的固定效应回归。

我有一个包含以下变量的数据集：公司 CEO 的总薪酬(TOTAL_COMP)，公司代码(GVKEY)，财政年度(FISCAL_YEAR)，一些公司特征（如资产(AT) ) 和公司的行业(SIC)。

虽然数据是专有的，但它看起来像：

例如

TOTAL_COMP <- c(100, 200, 50, 150, 300, 200, 150, 75)

GVKEY <- c("103", "103", "103", "103", "104", "104", "104", "104")

AT <- c(1000, 1100, 1200, 1300, 2000, 2100, 2200, 2300)

FISCAL_YEAR <- c(2015, 2016, 2017, 2018, 2015, 2016, 2017, 2018)

SIC <- c(78, 78, 78, 78, 80, 80, 80, 80)

我使用plm function 并使用行业(SIC) 固定效应运行固定效应回归。

model <- plm(TOTAL_COMP ~ AT, index = "SIC", model = "within", data = COMBINED_DATA)

我随后想在(GVKEY) 公司而不是在行业(SIC) 级别对标准误差进行聚类。但是，我不确定要使用哪个功能。我试过了：

coeftest(model, vcov = vcovHC(regression, type = "HC0", cluster = "group"))

但恐怕这会将标准错误聚集在行业(SIC) 而不是公司(GVKEY) 级别。如何计算公司(GVKEY) 级别的标准误？

（使用的包：plm 和 lmtest）

【问题讨论】：

我建议查看fixest 包。您可以阅读有关聚类标准错误的信息here。

标签： r plm

【解决方案1】：

您可以将SIC 设置为虚拟变量，并在公司级别对标准误进行聚类：

# The fixed effects model
model <- lm(TOTAL_COMP ~ AT + factor(SIC), data = COMBINED_DATA)

# The fixed effects model with cluster settings
library(estimatr)
Clu_robust <- lm_robust(TOTAL_COMP ~ AT + factor(SIC), 
                        data = COMBINED_DATA,
                        clusters = GVKEY, 
                        se_type = 'stata')

【讨论】：