【发布时间】:2020-12-06 04:49:09
【问题描述】:
这是随机森林分类如何工作的示例数据集。我知道通过选择随机 k 点然后取某种平均值来构建多个决策树?
但是在这种情况下,我有 10 棵树,有 10 个不同的数据点,如果我要选择随机的 k 个点,它会是这样的:
x_train = [10, 20, 30, 40, 50, 60, 70, 80, 90, 100]
y_train = [0, 0, 1, 0, 1, 1, 1, 0, 0, 1]
object = RandomForestClassifier(n_estimators=10, criterion='entropy')
object.fit(x_train, y_train)
然后我们制作一个图并拆分 random_k_1 以便它在每次拆分中最大化一个类别。
那我们该怎么办?比如取某种平均值?如果是,我们应该怎么做,我们只有 0, 1 作为 y^?很抱歉我无法解释这个问题,我迷路了,无法描述这个问题。
random_k_1 = [[10, 0], [30, 1], [70, 1]]
【问题讨论】:
标签: python machine-learning classification data-science random-forest