【发布时间】:2018-06-25 23:35:37
【问题描述】:
我想知道是否有一种方法可以在计算特征时自动选择过去的数据量。
例如,我可能想预测客户何时进行下一次购买,因此最好了解不同截止日期的购买次数或平均购买价格。例如过去 12 个月、过去 3 个月、7 天等内的购买情况。
使用功能工具解决此问题的最佳方法是什么?
【问题讨论】:
标签: featuretools
我想知道是否有一种方法可以在计算特征时自动选择过去的数据量。
例如,我可能想预测客户何时进行下一次购买,因此最好了解不同截止日期的购买次数或平均购买价格。例如过去 12 个月、过去 3 个月、7 天等内的购买情况。
使用功能工具解决此问题的最佳方法是什么?
【问题讨论】:
标签: featuretools
您可以使用featuretools.dfs 中的training window 参数创建仅使用一定数量历史数据的特征矩阵。设置训练窗口时,Featuretools 将使用cutoff time 和cutoff_time - training_window 之间的历史数据。这是文档中的示例:
window_fm, window_features = ft.dfs(entityset=es,
target_entity="customers",
cutoff_time=cutoff_times,
cutoff_time_in_index=True,
training_window="1 hour")
在确定哪些数据可以使用时,训练窗口会检查time_index列中的时间是否在训练窗口内。
【讨论】: