【问题标题】:R :How to get a proper latex regression table from a dataframe?R:如何从数据框中获取正确的乳胶回归表?
【发布时间】:2016-10-21 12:23:25
【问题描述】:

考虑以下示例

inds <- c('var1','','var2','')
model1 <- c(10.2,0.00,0.02,0.3)
model2 <- c(11.2,0.01,0.02,0.023)

df = df=data.frame(inds,model1,model2)
df
 inds model1 model2
 var1  10.20 11.200
        0.00  0.010
 var2   0.02  0.020
        0.30  0.023

这里你有一个带有系数和 P 值的自定义回归模型的输出(如果需要,我实际上可以显示任何其他统计数据,比如系数的标准误差)。

有两个变量,var1var2

例如,在模型1中,var1 的系数为10.2,P 值为0.00,而var2 的系数为0.02,P 值为0.30

是否有一个包可以自动处理这些(自定义)表格,并可以创建一个整洁的带有星号的 Latex 表格?

谢谢!

【问题讨论】:

  • 预先说明:不要使用 Stargazer。 It’s terrible.而且根本无法自定义。
  • 感谢@KonradRudolph。非常感谢任何建议。
  • 至于建议,我使用 ‹pander› 包和 ‹knitr› 组合来满足我所有的表格排版需求。但是,我手动对结果进行后处理以生成遵循‹booktabs› documentation 中规定的约定的表格。恐怕没有易于使用的解决方案。
  • 在这种情况下我们不能使用您的 pander 解决方案吗?代码会不会很难写?

标签: r latex linear-regression stargazer texreg


【解决方案1】:

这是使用texreg 的解决方案。

请注意,texreg >= 1.36.18 是必需的。

您在数据框中提供的信息(系数和 p 值)可以在数据框中以任意方式排列。因此,我们需要编写代码,从数据框中的适当位置选择这些数据,并使用它们创建一个texreg 对象。当您请求一个通用的(并且可能是可重用的)解决方案时,我们应该将代码包装在一个可重用的函数中。我将调用此函数extractFromDataFrame。所以这里是一个函数,它从数据框中提取信息并为不同的模型创建一个texreg 对象列表:

require("texreg")

extractFromDataFrame <- function (dataFrame) {
  coef.row.indices <- seq(1, nrow(dataFrame) - 1, 2)
  pval.row.indices <- seq(2, nrow(dataFrame), 2)
  texregObjects <- list()
  for (i in 2:ncol(dataFrame)) {
    coefs <- dataFrame[coef.row.indices, i]
    coefnames <- as.character(dataFrame[coef.row.indices, 1])
    pvalues <- dataFrame[pval.row.indices, i]
    tr <- createTexreg(coef = coefs, coef.names = coefnames, pvalues = pvalues)
    texregObjects[i - 1] <- list(tr)
  }
  return(texregObjects)
}

在此函数中,我们首先定义系数存储在数据帧的哪些行中以及 p 值存储在哪些行中。然后我们创建了一个空列表,其中存储了texreg 对象。我们遍历所有列,但第一列仅包含标签。在每个模型列中,我们保存系数、它们的名称和 p 值,然后将它们交给 createTexreg 构造函数,该函数基于数据。我们将texreg 对象添加到列表中。最后,我们返回texreg 对象列表。

我们现在可以将该函数应用于任何看起来像问题中提供的数据框,具有任意数量的列 (> 1)。在这种情况下,在将函数应用到 df 对象之后,如果我们想确保我们做的一切正确,我们可能想要打印列表的内容:

tr <- extractFromDataFrame(df)
tr

事实上,结果包含相关数据:

[[1]]

No standard errors were defined for this texreg object.
No decimal places were defined for the GOF statistics.

     coef.   p
var1 10.20 0.0
var2  0.02 0.3

No GOF block defined.

[[2]]

No standard errors were defined for this texreg object.
No decimal places were defined for the GOF statistics.

     coef.     p
var1 11.20 0.010
var2  0.02 0.023

No GOF block defined.

现在我们可以简单地将texreg 对象列表交给screenreg,例如screenreg(tr),结果如下:

========================
      Model 1    Model 2
------------------------
var1  10.20 ***  11.20 *
var2   0.02       0.02 *
========================
*** p < 0.001, ** p < 0.01, * p < 0.05

htmlreg 创建 HTML 表格。或者,按照原始问题中的要求,发送至texreg 以创建 LaTeX 表。 texreg(tr, single.row = TRUE) 的输出如下所示:

\begin{table}
\begin{center}
\begin{tabular}{l c c }
\hline
 & Model 1 & Model 2 \\
\hline
var1 & $10.20^{***}$ & $11.20^{*}$ \\
var2 & $0.02$        & $0.02^{*}$  \\
\hline
\multicolumn{3}{l}{\scriptsize{$^{***}p<0.001$, $^{**}p<0.01$, $^*p<0.05$}}
\end{tabular}
\caption{Statistical models}
\label{table:coefficients}
\end{center}
\end{table}

可以修改此解决方案以适应标准误差、置信区间或拟合优度统计数据。

各种texreg 参数可用于自定义输出,包括使用booktabs 包或通过dcolumn 进行十进制对齐。

请注意,您不应将数据框称为 df,因为该对象名称已在 stats 包中定义。

【讨论】:

  • 我能说什么?太棒了!
猜你喜欢
  • 1970-01-01
  • 2023-04-03
  • 2016-02-03
  • 1970-01-01
  • 2012-03-28
  • 1970-01-01
  • 2013-12-31
  • 2013-09-01
  • 1970-01-01
相关资源
最近更新 更多