【发布时间】:2019-10-31 01:59:55
【问题描述】:
我有 2 个数据集。 df1 存储关于餐厅的数据,df2 是天气数据。
df1
date how many customers came Sales($) how many pokes used (kg) ...
0 20180101 120 44520 58
1 20180102 270 57950 60
2 20180103 290 65320 90
...
df2
date temperature precipitation ...
0 20180101 35 0.2
1 20180102 23 0.5
2 20180103 31 0.6
...
我想制作一个模型,可以预测未来一天将使用多少次戳。
我不知道将来会有多少客户,以及将来会有多少销售额。所以我只使用天气数据来建立模型。
我尝试使用天气数据预测sales,并使用天气数据和预测sales数据预测how many pocks used,但得分比只使用天气数据的模型还要差。
有没有办法利用df1中的其他数据?
【问题讨论】:
-
只需按日期合并 2 个 data.frames 并在模型中使用任意数量的变量作为预测变量。你的问题有什么我遗漏的吗?
-
@Simon 抱歉,我已经编辑了我的问题。我想制作一个模型,可以预测未来一天将使用多少次戳。我可以使用天气预报数据。但是像
sales这样的数据要到那一天才能知道。 -
如果您有一些过去的历史,那么还值得查看数据中的趋势——许多时间序列都有每周和每年的周期性。您可能会从这本免费的在线教科书中得到一些东西:otexts.com/fpp2
标签: r pandas machine-learning scikit-learn scipy