【问题标题】:SPSS: Comparing regression coefficient from multiple modelsSPSS:比较多个模型的回归系数
【发布时间】:2014-10-13 12:00:59
【问题描述】:

假设我将房价作为因变量,以下作为自变量:

  1. 年龄
  2. 区域
  3. 地板
  4. 步行到最近的火车站所需的时间 (time_walk)
  5. 乘坐火车从最近的车站到 CBD 车站的通勤时间 (time_train)

在给定time_train 的不同范围的情况下,有没有办法比较time_walk 的系数。从本质上讲,我想要实现的是调查人们是否重视步行,考虑到捷运旅行时间的变化。

  • 模型 A:(0-9 分钟 time_train):Walking_Time 如何影响房价?

  • 模型 B:(10-19 分钟 time_train):Walking_Time 如何影响房价?

  • 模型 C:(20-29 分钟 time_train):Walking_Time 如何影响房价?

我知道我无法创建 4 个模型,每个模型都只包含相关细节(例如,0-9 分钟的训练时间、10-19 分钟的训练时间……等等),因为 n 数字会有所不同。这种比较系数估计值是不公平的。

【问题讨论】:

  • 你能添加一点样本数据吗?此外,将其发布在 Cross-Validated 上可能是个好主意。我的第一步是制作 4 个模型并观察结果:它们是相似的,还是有不同的结果?
  • 感谢@ChristianSauer,将相应地进行调整
  • 为什么不在模型中引入一个虚拟变量来捕捉火车时间与步行时间的差异。
  • 注:被交叉发布到stats.stackexchange.com/q/112587/17060

标签: regression spss


【解决方案1】:

您的建议是walking_time 的效果取决于time_train。这是一个交互假设!如果time_train 是一个序数水平变量,您可以使用变量walking_time 为每个类别虚拟变量添加交互项。如果time_train 是一个连续变量,则一个额外的项就足够了(walking_time * time_train)。

【讨论】:

    猜你喜欢
    • 2021-12-24
    • 2018-08-10
    • 2017-03-12
    • 2020-07-19
    • 2012-09-16
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多