【问题标题】:R - Regression Analysis for LogarthmicR - 对数回归分析
【发布时间】:2018-01-06 11:34:31
【问题描述】:

我执行回归分析并尝试为ggplot2 中的数据集 diamonds.csv 找到最佳拟合模型。我使用价格(响应变量)与克拉,并执行线性回归、二次回归和三次回归。这条线不是最合适的。我意识到来自 excel 的对数具有最佳拟合线。但是,我不知道如何在 R 中编写代码来找到对数拟合线。任何人都可以帮忙吗?

比较价格与克拉

model<-lm(price~carat, data = diamonds)

模型2使用多项式进行比较

model2<-lm(price~carat + I(carat^2), data = diamonds)

在模型 3 中使用立方

model3 <- lm(price~carat + I(carat^2) + I(carat^3), data = diamonds)

如何在 R 中对日志进行编码以获得与 excel 相同的结果?

y = 0.4299ln(x) - 2.5495 R² = 0.8468

谢谢!

【问题讨论】:

    标签: r non-linear-regression


    【解决方案1】:

    您从 excel y = 0.4299ln(x) - 2.5495 报告的结果不包含任何多项式或三次项。你想做什么? price 非常倾斜,就像说“收入”一样,通常的做法是从中获取日志。这也提供了您所指的 R2,但截距和克拉参数的系数非常不同。

    m1 <- lm(log(price) ~ carat, data = diamonds)
    summary(m1)
    Call:
    lm(formula = log(price) ~ carat, data = diamonds)
    
    Residuals:
        Min      1Q  Median      3Q     Max 
    -6.2844 -0.2449  0.0335  0.2578  1.5642 
    
    Coefficients:
                Estimate Std. Error t value Pr(>|t|)    
    (Intercept) 6.215021   0.003348    1856   <2e-16 ***
    carat       1.969757   0.003608     546   <2e-16 ***
    ---
    Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
    
    Residual standard error: 0.3972 on 53938 degrees of freedom
    Multiple R-squared:  0.8468,    Adjusted R-squared:  0.8468 
    F-statistic: 2.981e+05 on 1 and 53938 DF,  p-value: < 2.2e-16
    

    【讨论】:

    • 非常感谢您的帮助!我在你的帮助下解决了这个问题。 logmodel
    • 太棒了!不知道为什么你想要克拉的日志,但任何适合你的需要!如果您喜欢,请点赞/接受答案!
    • 我是新手。我在哪里投票并喜欢你的回答?
    • 不用担心,您可以通过单击我的答案左侧向上的三角形(就在数字零上方)进行投票(通过单击向下的三角形进行投票)。您还应该看到一个复选标记图标(V 形,右腿较长)。如果您单击它,您将接受答案,因为您已经回答了问题。见:stackoverflow.com/help/accepted-answer
    猜你喜欢
    • 2023-03-15
    • 2018-12-26
    • 2018-07-26
    • 1970-01-01
    • 2019-09-11
    • 2019-08-17
    • 2016-12-11
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多