【问题标题】:random_state in random forest随机森林中的 random_state
【发布时间】:2021-03-30 11:12:14
【问题描述】:

我刚刚学会了如何使用机器学习模型随机森林;但是,尽管我阅读了有关 random_state 参数的信息,但我无法理解它的作用。比如random_state = 0 random_state = 300有什么区别 谁能解释一下?

【问题讨论】:

    标签: python data-science random-forest random-seed


    【解决方案1】:

    train_test_split 将数组或矩阵拆分为随机训练和测试子集。这意味着每次在不指定 random_state 的情况下运行它时,都会得到不同的结果,这是预期的行为。 当您使用random_state=any_value 时,您的代码将在您运行代码时显示完全相同的行为。

    【讨论】:

      【解决方案2】:

      另外,大多数人在我们使用random_state时都会使用数字42。

      例如,random_state = 42,这是有原因的。 以下是答案。

      在 Douglas Adams 的《银河系漫游指南》中,数字 42 是“生命、宇宙和万物终极问题的答案”,由名为 Deep Thought 的巨型超级计算机在 750 万周期内计算得出年。不幸的是,没有人知道问题是什么

      【讨论】:

        【解决方案3】:

        随机森林通过随机抽样数据和特征来引入随机性。由于这些随机抽样,在完全相同的数据上运行 RF 可能会为每次运行产生不同的结果。将种子固定为常数,即 1 将消除这种随机性,并且每次运行都会产生相同的结果。

        【讨论】:

          猜你喜欢
          • 2016-07-23
          • 1970-01-01
          • 2017-06-13
          • 2015-09-16
          • 2017-03-15
          • 2014-08-07
          • 2015-10-15
          • 2015-02-15
          • 2018-07-10
          相关资源
          最近更新 更多