【发布时间】:2019-07-04 14:26:43
【问题描述】:
我正在做多元回归问题。我有以下数据集如下。
rank--discipline--yrs.since.phd--yrs.service--sex--salary
[ 1 1 19 18 1 139750],......
我将薪水作为因变量,将其他变量作为自变量。在做了数据预处理之后,我运行了梯度下降,回归模型。我估计了所有独立特征的偏差(截距)系数。 我想为实际值和回归线做散点图 对于我预测的假设。由于我们这里有不止一个功能,
我有以下问题。
在绘制实际值(散点图)时,如何确定 x 轴值。意思是,我有价值观列表。例如,第一行 [1,1,19,18,1]=>139750 如何将 [1,1,19,18,1] 转换或映射到 x 轴。?我需要以某种方式将 [1,1,19,18,1] 设为一个值,因此我可以在图中标记 (x,y) 的一个点。
在绘制回归线时,特征值是什么,所以我可以计算假设值。? 现在的意思是,我有所有特征的截距和权重,但我没有特征值。我现在如何决定特征值?
我想计算积分并使用 matplot 来完成工作。我知道有很多工具可以在外面使用,包括 matplotlib 来完成这项工作。但我想得到基本的了解。
谢谢。
【问题讨论】:
-
如果数据集中有多个目标,最好的方法是分别绘制每个目标,即每个图中只有一个目标。至于你的问题1,数据是存储为numpy数组还是pandas DataFrame?来到问题 2,你能解释一下你想在哪里绘制它。只有两个变量吗?您是否已经有了系数和截距,最重要的是,您能否在输入数据库上发布 df.describe() 的结果。另外,如果可能,请尝试重新构建您的第二个问题,因为我仍然对此感到有些困惑。
-
嗨,我的数据集中只有一个目标(薪水)和 5 个特征(等级、纪律等)。我正在为 df 使用熊猫。我对 point1 的查询是,假设第一个数据实例是 [1,1,19,18,1],目标值为 139750。如何在 x,y 轴上绘制这些值。由于 x 轴有多个值,我该如何转换它。?第二个问题的查询是,假设 [1,2,3,4,5,6] 是我为这个数据集到达的截距和系数。截距=1,其余是特征的权重。公式为 h(x)=1+2X1+3X2+4X3+5X4+6X5。 X1、X2...X5 的值是多少?
-
不是编程问题,更适合Cross Validated。
标签: machine-learning regression linear-regression