【发布时间】:2019-06-21 05:20:54
【问题描述】:
我计算了两个因变量(地块/房屋大小与成本)的相关性,相关性为 0.87。如果尺寸增加或减少,我想使用该指数来衡量成本的增加或减少。是否可以使用相关性?怎么样?
【问题讨论】:
标签: statistics data-science correlation pearson-correlation
我计算了两个因变量(地块/房屋大小与成本)的相关性,相关性为 0.87。如果尺寸增加或减少,我想使用该指数来衡量成本的增加或减少。是否可以使用相关性?怎么样?
【问题讨论】:
标签: statistics data-science correlation pearson-correlation
Correlation 仅根据我们拥有的数据告诉我们两个变量线性相关的程度,但它并没有提供在给定另一个变量值的情况下计算变量值的方法。
如果变量是线性相关的,我们可以使用线性回归预测当变量 X 具有某个值时变量 Y 将假定的实际值:
我们的想法是尝试将数据拟合为线性函数,并使用它来预测值: Y = bX + a
通常我们首先使用相关系数(例如 Pearson 系数)发现两个变量是否相关,然后我们使用回归方法(例如线性)来预测给定另一个感兴趣变量的值。
这是一个易于理解的 Python 线性回归教程,其中包含一些理论: https://realpython.com/linear-regression-in-python/#what-is-regression
这里有一个关于房价预测典型问题的教程: https://blog.akquinet.de/2017/09/19/predicting-house-prices-on-kaggle-part-i/
【讨论】: