【发布时间】:2021-12-25 10:51:37
【问题描述】:
我目前正在研究 r 中的固定效应回归。
我有一个包含以下变量的数据集:公司 CEO 的总薪酬(TOTAL_COMP),公司代码(GVKEY),财政年度(FISCAL_YEAR),一些公司特征(如资产(AT) ) 和公司的行业(SIC)。
虽然数据是专有的,但它看起来像:
例如
TOTAL_COMP <- c(100, 200, 50, 150, 300, 200, 150, 75)
GVKEY <- c("103", "103", "103", "103", "104", "104", "104", "104")
AT <- c(1000, 1100, 1200, 1300, 2000, 2100, 2200, 2300)
FISCAL_YEAR <- c(2015, 2016, 2017, 2018, 2015, 2016, 2017, 2018)
SIC <- c(78, 78, 78, 78, 80, 80, 80, 80)
我使用plm function 并使用行业(SIC) 固定效应运行固定效应回归。
model <- plm(TOTAL_COMP ~ AT, index = "SIC", model = "within", data = COMBINED_DATA)
我随后想在(GVKEY) 公司而不是在行业(SIC) 级别对标准误差进行聚类。但是,我不确定要使用哪个功能。我试过了:
coeftest(model, vcov = vcovHC(regression, type = "HC0", cluster = "group"))
但恐怕这会将标准错误聚集在行业(SIC) 而不是公司(GVKEY) 级别。如何计算公司(GVKEY) 级别的标准误?
(使用的包:plm 和 lmtest)
【问题讨论】:
-
我建议查看
fixest包。您可以阅读有关聚类标准错误的信息here。