【问题标题】:What is the importance of random-state parameter in random forest algorithm?随机森林算法中随机状态参数的重要性是什么?
【发布时间】:2019-11-07 03:51:55
【问题描述】:

随机森林有几个参数,其中之一是随机状态。我不知道它是做什么的,对射频算法有多重要。

【问题讨论】:

    标签: python-3.x machine-learning random-forest


    【解决方案1】:

    随机森林只不过是bagging 应用于决策树,我们需要随机数来生成随机样本(引导样本),在这些样本上拟合树木。但是我们在这里可能会遇到一个问题,每次生成一组随机数时,程序都会生成一组完全不同的随机数,这会再次影响您的引导样本,进而影响拟合的树。因此,为了控制随机数生成所涉及的随机性,并在每次使用随机种子时复制同一组随机数。 random_state 是一个参数,它允许您为随机森林中的随机数生成过程设置随机种子。

    为什么需要设置随机种子的一个主要原因是为了实验的可复制性。最好设置一个随机种子并开始构建模型,这样每次构建模型时使用相同的数据都会得到完全相同的模型。

    这种设置随机种子的想法不仅限于随机森林,任何需要随机数的算法(神经网络、决策树等)都会有这个参数。

    希望这会有所帮助!

    【讨论】:

      猜你喜欢
      • 2016-06-24
      • 1970-01-01
      • 2021-05-09
      • 2015-05-19
      • 1970-01-01
      • 2020-11-23
      • 2021-08-29
      • 2017-08-29
      • 2021-07-23
      相关资源
      最近更新 更多