【发布时间】:2021-03-30 11:12:14
【问题描述】:
我刚刚学会了如何使用机器学习模型随机森林;但是,尽管我阅读了有关 random_state 参数的信息,但我无法理解它的作用。比如random_state = 0 和 random_state = 300有什么区别
谁能解释一下?
【问题讨论】:
标签: python data-science random-forest random-seed
我刚刚学会了如何使用机器学习模型随机森林;但是,尽管我阅读了有关 random_state 参数的信息,但我无法理解它的作用。比如random_state = 0 和 random_state = 300有什么区别
谁能解释一下?
【问题讨论】:
标签: python data-science random-forest random-seed
train_test_split 将数组或矩阵拆分为随机训练和测试子集。这意味着每次在不指定 random_state 的情况下运行它时,都会得到不同的结果,这是预期的行为。
当您使用random_state=any_value 时,您的代码将在您运行代码时显示完全相同的行为。
【讨论】:
另外,大多数人在我们使用random_state时都会使用数字42。
例如,random_state = 42,这是有原因的。 以下是答案。
在 Douglas Adams 的《银河系漫游指南》中,数字 42 是“生命、宇宙和万物终极问题的答案”,由名为 Deep Thought 的巨型超级计算机在 750 万周期内计算得出年。不幸的是,没有人知道问题是什么
【讨论】:
随机森林通过随机抽样数据和特征来引入随机性。由于这些随机抽样,在完全相同的数据上运行 RF 可能会为每次运行产生不同的结果。将种子固定为常数,即 1 将消除这种随机性,并且每次运行都会产生相同的结果。
【讨论】: