【发布时间】:2018-08-08 10:38:26
【问题描述】:
机器学习新手,请多多包涵,谢谢!
我有三个问题要问,所以如果您在回答时提及问题编号会很有帮助。
所以我想在应用机器学习算法之前为我的训练数据执行特征选择。我将使用相同的数据集在许多不同的 ML 算法上运行,以决定什么是最好的,因此如果我可以只进行一次特征选择并将新数据集传递给各种算法,效率会更高。
注意:我在 Python3 中编码,我将使用 BorutaPy 进行特征选择。 [https://github.com/scikit-learn-contrib/boruta_py]
问题 1)
在执行特征选择之前我需要知道我正在使用什么算法吗?或者我可以只执行我的特征选择,然后使用任何算法,即;特征选择是否取决于所使用的算法类型?
问题 2)
我可以对回归和分类问题执行相同的特征选择吗?
问题 3)
除了上面提到的一切,最好对回归问题使用正则化并为分类问题执行特征选择?
谢谢!
【问题讨论】:
标签: python-3.x machine-learning classification regression feature-selection