【发布时间】:2018-10-05 06:40:35
【问题描述】:
我一直在使用我的 java 实现遵循cart 算法的本指南,并且想知道是否有更快的方法来选择最佳分割。
指南建议以下步骤:
for each feature:
for each value of the feature:
make a split
remember GINI score if a split is less than previous min GINI
是否可以对该过程进行任何修改以牺牲局部精度来提高速度,但不会导致整体精度下降?虽然这可以很容易地并行化,但循环每个属性仍然很昂贵,并且选择单个拆分是有价值的。
【问题讨论】:
标签: java python machine-learning classification