【发布时间】:2019-11-07 03:51:55
【问题描述】:
随机森林有几个参数,其中之一是随机状态。我不知道它是做什么的,对射频算法有多重要。
【问题讨论】:
标签: python-3.x machine-learning random-forest
随机森林有几个参数,其中之一是随机状态。我不知道它是做什么的,对射频算法有多重要。
【问题讨论】:
标签: python-3.x machine-learning random-forest
随机森林只不过是bagging 应用于决策树,我们需要随机数来生成随机样本(引导样本),在这些样本上拟合树木。但是我们在这里可能会遇到一个问题,每次生成一组随机数时,程序都会生成一组完全不同的随机数,这会再次影响您的引导样本,进而影响拟合的树。因此,为了控制随机数生成所涉及的随机性,并在每次使用随机种子时复制同一组随机数。 random_state 是一个参数,它允许您为随机森林中的随机数生成过程设置随机种子。
为什么需要设置随机种子的一个主要原因是为了实验的可复制性。最好设置一个随机种子并开始构建模型,这样每次构建模型时使用相同的数据都会得到完全相同的模型。
这种设置随机种子的想法不仅限于随机森林,任何需要随机数的算法(神经网络、决策树等)都会有这个参数。
希望这会有所帮助!
【讨论】: