【发布时间】:2021-03-07 21:21:36
【问题描述】:
在某些情况下,我正在尝试进行一些匹配以查看该公司是否与另一家公司匹配。我已经对名称匹配、地址匹配、域匹配等数据进行了特征工程......
从那里,我还创建了另一个功能,该功能基于一种方法,其中包含名称匹配、地址匹配和域匹配的组合,并根据我认为在确定时更重要的直觉来设置它们的权重一场比赛。让我们将此功能称为“最终得分”。这个分数让我可以粗略估计这些是否匹配。
现在是我实现逻辑回归的部分。我尝试使用我设计的没有“最终分数”和“最终分数”的功能构建逻辑回归,结果非常相似。
注意:我确实检查了功能的重要性,它非常重要。
我的问题是,在训练模型时,将“最终得分”作为逻辑回归模型的特征包含在内是一种好的做法吗?
【问题讨论】:
-
你考虑过做k-nearest吗?
标签: python machine-learning logistic-regression