【发布时间】:2020-02-22 21:45:53
【问题描述】:
我使用了来自 sklearn 的mutual_info_classif 和 selectPercentile 在数据集中进行特征选择。我发现我可以将 random_state 设置为 0 以确保每次选择的功能都可以相同,例如下面的代码:
mi = mutual_info_classif(X_train, y_train, random_state=0)
print(mi)
sel_mi = SelectPercentile(mutual_info_classif, percentile=10).fit(X_train,y_train)
另一个,我不需要设置 random_state 并使其成为默认值。但这会使每个选择都会有所不同。
mi = mutual_info_classif(X_train, y_train)
我想知道如果每次的特征选择都一样,如何判断是不是最好的特征选择?
如果每次选择都不一样,是否意味着这种特征选择没有意义?
【问题讨论】:
标签: random scikit-learn feature-selection