【发布时间】:2018-04-04 23:39:51
【问题描述】:
我有一个数据集(租金与卧室数量和社区数量)。
我想将租赁价格建模为基本价格、与卧室数量相关的标量和与社区相关的标量的乘积。
例如Mayfair 的 2 床房可能是 R = $100*1.2*1.5
在数学上我猜这看起来像: 租金=基础*(a1B1+a2B2+a3B3...)*(k1N1+k2N2+...)
其中 B2 是二进制变量,如果房产有 2 间卧室,则为 1,否则为 0;在上面的例子中,a2 是 1.2; N1 是一个二进制变量,如果属性在'Neighborhood 1'则为1,等等。
scikit-learn 可以帮助建模这样的事情吗?我可以对变量的线性组合进行建模:
价格 = a1B1 + a2B2 + ... + k1N1 + k2N2
但是我看不到任何方法可以对乘法模型进行建模,也看不到任何方法可以将具有分类变量的乘法模型转换为线性模型。
【问题讨论】:
-
您可以通过将数据通过
PolynomialFeatures(2, interaction_only=True)传递给线性模型来添加乘法特征。
标签: python scikit-learn regression