【问题标题】:Time series normalization, how to handle zeros时间序列归一化,如何处理零
【发布时间】:2013-10-15 07:53:23
【问题描述】:

我正在研究一款游戏的玩家流失预测模型。我有 60 天的时间序列轮数。在将时间序列提供给分类算法之前,我需要对时间序列进行归一化。

我正在考虑通过将 x 转换为 x/Max(x) 来使用 min-max 归一化。 60 天时间序列中的 Max(x) 不一定能捕捉到玩家通常一天玩多少次的峰值。

但是通过将 x 转换为 (x-mean(x))/std(x) 的 z 归一化将不起作用,因为我需要保留没有播放的日子的信息为零。进行 z 归一化将 0 映射到不同的值,这使得它们无法比较。

是否有一个规范化方案不需要关于时间序列最大值的信息,并且可以将 0 映射到 0?

【问题讨论】:

    标签: time-series normalization data-mining churn


    【解决方案1】:

    您可以通过将数组中的每个值除以数组中的值的总和来将值转换为概率(归一化因子“sum to unity”)。即,将 x 转换为 x./sum(x) 这会将 0 个值映射到 0,并且不需要有关最大值的信息。

    【讨论】:

    • 这个不能回答。放评论
    猜你喜欢
    • 1970-01-01
    • 1970-01-01
    • 1970-01-01
    • 2014-08-17
    • 1970-01-01
    • 1970-01-01
    • 2010-10-17
    • 1970-01-01
    • 1970-01-01
    相关资源
    最近更新 更多