【发布时间】:2018-04-22 11:38:37
【问题描述】:
我使用来自sklearn 的RandomForestClassifier 来创建预测模型。现在我有了一个准确度不错的模型。
现在我想建议应该使用哪些输入,以最大限度地提高获得我想要的价值的机会。我从feature_importances_ 获得了权重,但我不知道如何将其转化为推荐。
任何帮助将不胜感激!
【问题讨论】:
标签: python scikit-learn random-forest
我使用来自sklearn 的RandomForestClassifier 来创建预测模型。现在我有了一个准确度不错的模型。
现在我想建议应该使用哪些输入,以最大限度地提高获得我想要的价值的机会。我从feature_importances_ 获得了权重,但我不知道如何将其转化为推荐。
任何帮助将不胜感激!
【问题讨论】:
标签: python scikit-learn random-forest
RandomForestClassifier 的 feature_importances_ 返回一个数组,其中包含每个特征的数字。数组中的数字越大,特征的重要性就越高。您可以使用
将其与您的功能相匹配df.columns
获取特征,然后将它们与重要性相匹配。然后,您可以使用循环遍历并制作字典以将特征与数字匹配。然后您可以找到最高的数字并推荐这些功能。希望这有帮助!
【讨论】: