【发布时间】:2018-11-08 22:15:55
【问题描述】:
我想进行超参数调整,为此,我想使用 RandomizedSearchCV 或 GridSearchCV。我尝试运行随机森林分类器的两种方法。
我发现网格搜索将搜索我的参数网格的所有可能组合,但随机搜索仅搜索 10 种可能的组合。假设它采用任意 10 个随机参数集,它可能会给我错误的最佳参数。另一方面,如果我使用 GridSearch 方法,那么它会给我很大的运行时间。现在,我对这两种方法感到困惑。我应该使用哪个?或者我可以做一些改变,在可接受的运行时给我最好的参数吗?
【问题讨论】:
-
请解释您的用例。如果您需要所有组合,那么使用随机搜索有什么意义?
-
@JoeSebin 对不起,如果我不清楚。但我想获得最佳参数。但是我的问题是随机搜索可能不会给我这个,并且网格搜索需要很多时间。那么,我能做些什么来在可接受的时间内获得最佳参数吗?
-
我建议你尝试阅读No Free Lunch Theorem。
标签: python python-3.x machine-learning scikit-learn classification