【发布时间】:2018-06-21 03:19:57
【问题描述】:
我正在尝试使用机器学习来预测光伏电池的发电量。我使用了随机森林和 SVM RBF 回归模型,结果非常准确。然而,据观察,预测模型在晴天时表现最好,而在阴雨天时效果不佳。
我决定将这个问题分解为子问题,并构建了一个聚类、分类和回归管道。首先,我进行 k-means 聚类以标记日期,然后,使用聚类标签作为目标变量训练分类器。然后我为每个集群应用不同的回归模型。
我对机器学习领域比较陌生,想知道这种方法是否有意义?另外,我是在引入冗余吗?如果有人能告诉我这种方法的优缺点,那就太好了。
【问题讨论】:
-
我投票决定将此问题作为离题结束,因为它已在 CV 上交叉发布(它略微更有意义):stats.stackexchange.com/q/322582/1352跨度>
标签: machine-learning classification regression cluster-analysis random-forest