【问题标题】:Linear regression model for subset within dataset? [closed]数据集中子集的线性回归模型? [关闭]
【发布时间】:2021-07-04 16:04:39
【问题描述】:

我有一个数据集,其中包含 300 多个不同车型、一些汽车、一些自行车和 10 多行特征(颜色、尺寸、mpg 等)的条目。

如果汽车/自行车实际上并未在数据集中分类(尽管它是有序的,即仅列1:200 是汽车,201:300 是自行车)。

我认为我需要创建数据集的子集,但我不知道如何将原始数据集中的特征与子集相关联。

抱歉,如果解释不当,感谢任何帮助!

【问题讨论】:

  • 它的解释真的很糟糕。你能提供一个你的数据集的例子和你尝试过的代码吗

标签: r model regression


【解决方案1】:

我认为您应该首先重组您的数据框(您可能希望在行中查看车辆模型,在列中查看特征。我建议使用 t() 作为转置函数,然后添加另一个带有虚拟变量的列(如果汽车类型是汽车,则为 1如果不是,则为 0)。现在您可以使用 glm() 如果您想拟合逻辑回归或使用 lm() 进行线性回归,可以在 mpg 上回归汽车类型。

【讨论】:

    猜你喜欢
    • 1970-01-01
    • 2019-10-13
    • 2016-02-13
    • 1970-01-01
    • 2013-03-15
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多