【问题标题】:WEKA - weather predictionWEKA - 天气预报
【发布时间】:2013-06-22 16:53:04
【问题描述】:

我对机器学习和集群的概念还很陌生。我已经安装了 Weka,并试图弄清楚它是如何工作的。目前,我的训练数据如下。

@relation weather

@attribute year real
@attribute temperature real
@attribute warmer {yes,no}

@data

1956    ,   68.98585    ,   yes
1957    ,   67.52131    ,   yes
1958    ,   65.853386   ,   no
1959    ,   66.32705    ,   yes
1960    ,   65.89773    ,   no

所以,我正在尝试建立一个模型,该模型应该预测它是否每年都在变暖。

如果我必须预测 1961 年是温暖还是凉爽,我应该提供如下测试数据吗?

@relation 天气

@attribute year real
@attribute temperature real

@data

1961    ,   70.98585    

我已经删除了我想使用我之前提供的训练集进行预测的列加热器。我可以使用 Weka 提供的任何算法(J48、BayesNet 等)。有人可以帮我弄清楚如何理解这些概念吗?

【问题讨论】:

    标签: weka


    【解决方案1】:

    您无需自己制作训练集和测试集,Weka 会为您完成。即使你这样做了,也不要从测试集中删除要预测的值——Weka 会确保一切正常,但需要实际值来确定预测是否正确并告诉你模型的执行情况。

    您的问题是分类问题,即您想预测标签“是”或“否”。并非 Weka 中的所有算法都适用,但没有显示为灰色的算法(如果您使用 GUI)。

    一般来说,您不太可能使用现有数据获得好的结果。这更像是一个时间序列预测任务(即,给定这些过去的值,它在未来将如何发展),Weka 并没有真正提供算法。您可以在Wikipedia 上找到更多信息。

    要使用 Weka 获得更好的模型,您可以添加前一年(或前 2 年)的温度值作为特征,但最终听起来您想使用可以进行时间序列分析和预测的东西。

    【讨论】:

    • 我有一个庞大的天气数据集。使用 Hadoop,我得到了一个更简单的数据集,其中包含年份和该年的平均温度。使用这些数据,现在我必须预测气候模式并确定它是逐年变暖还是变冷。我收集了 1950 年到 2013 年的数据,但它只有 2 列。它们是,>。如何让机器学习和聚类确定气候模式?
    • 听起来你想对一系列温度使用线性回归,看看它是否有正梯度。
    • 再次感谢。我看到线性回归可以应用于数值。那么这是否意味着我应该对平均温度应用线性回归并尝试预测天气?如何判断预测是否正确?我的意思是,标准差误差应该更小吗?
    猜你喜欢
    • 2011-05-16
    • 2016-06-10
    • 1970-01-01
    • 1970-01-01
    • 2019-04-15
    • 2012-11-25
    • 2011-11-15
    • 1970-01-01
    • 2013-02-09
    相关资源
    最近更新 更多