【问题标题】:How to calculate features for forecasted time frame如何计算预测时间范围的特征
【发布时间】:2019-11-14 11:30:03
【问题描述】:

我有一个关于如何计算未来时间范围内的特征的问题。考虑下面的数据集,今天考虑的是:2019-11-11。我有过去 2 年的每日数据,以下是最后 6 行:

Date, Temperature, Sales

2019-11-06, 25.5, 500000

2019-11-07, 24.2, 550000

2019-11-08, 25.1, 560000

2019-11-09, 22.6, 510000

2019-11-10, 22.3, 520000

2019-11-11, 24.4, 535000

现在我必须预测 2019-11-12、2019-11-13、2019-11-14 的销售额。为了预测这些日期的销售额,我必须向机器学习训练模型提供以下测试数据:

Date, Temperature

2019-11-12, temperatureX

2019-11-13, temperatureY

2019-11-14, temperatureZ

temperatureX、temperatureY 和 temperatureZ 的值是多少,因为这些值也来自未来?

【问题讨论】:

    标签: azure machine-learning


    【解决方案1】:

    有不同的解决方案。

    我建议你从Time-series Forecasting using Azure AutoML 开始或者深入挖掘Auto-train a time-series forecast model

    如果您需要可解释的模型,您可以使用 R 或 Python 训练线性模型 (LM) 或其他回归模型。从日期派生一些特征可能是有意义的,例如月份、月份、季节等。这种方法的好处是您可以计算置信区间。 因为它是一个多元时间序列,也可以看看 Vector Auto Regression,见A Multivariate Time Series Guide to Forecasting and Modeling (with Python codes)

    如果您只是对预测值感兴趣,可以尝试循环神经网络或 LSTM。见 GitHub Azure/DeepLearningForTimeSeriesForecasting

    【讨论】:

      【解决方案2】:

      简单的答案?如果您没有在预测时解释您的目标的自变量,您将无法预测。

      话虽如此,您通常可以通过简单的网络搜索获得至少提前一周的天气预报。因此,如果您不需要非常大的最大范围,您可以使用预测的天气预报作为您的温度值(x、y 和 z)。然后,您的再培训期将变为每周一次,或者您可以找到现有天气预报的多远。

      参考:https://datascience.stackexchange.com/questions/27171/what-to-give-as-predictors-to-predict-future-values

      【讨论】:

        猜你喜欢
        • 2018-09-27
        • 1970-01-01
        • 1970-01-01
        • 2018-12-28
        • 1970-01-01
        • 2021-07-18
        • 1970-01-01
        • 2023-01-13
        • 2017-10-15
        相关资源
        最近更新 更多