【发布时间】:2015-11-20 11:13:17
【问题描述】:
我已经向question 询问了有关在单个数据集中存储多个回归的系数和标准误的问题。
让我重申一下我最初问题的目标:
我想运行几个回归并将它们的结果存储在一个 我以后可以用于分析的 DTA 文件。我的限制是:
- 我无法安装模块(我正在为其他人编写代码,而不是 确定他们安装了哪些模块)
- 一些回归变量是因子变量。
- 每个回归仅在依赖项上有所不同 变量,所以我想将其存储在最终数据集中以保留 跟踪系数/方差对应的回归。
Roberto Ferrer 建议的解决方案在我的测试数据上运行良好,但在某些其他类型的数据上效果不佳。原因是我的样本从一个回归到下一个回归略有变化,并且某些因子变量在每个回归中取值的数量不同。这会导致固定效应(使用i.myvar 作为回归量动态创建)不具有相同的基数。
假设我决定使用i.year 设置年份固定效应(如:特定年份的截距),但在一个回归中没有观察到 2006 年。这意味着这个特定的回归将少一个回归量(不会创建对应于 year==2006 的虚拟对象),因此会生成一个较小的矩阵来存储系数。
这会在尝试将矩阵堆叠在一起时导致一致性错误。
我想知道是否有办法使初始解决方案对不同数量的回归变量具有鲁棒性。 (也许将每个回归保存为 dta,然后合并?)
我仍然受到不能依赖外部包的约束。
【问题讨论】:
-
坦白说,字太多了!请给出具体的代码和可重现的例子。否则很可能会被判断为跑题。见stackoverflow.com/help/mcve
标签: matrix regression stata