【发布时间】:2018-06-26 06:46:31
【问题描述】:
我有以下日期数据:
item,Date
camera,10/12/2017
mobile,10/12/2017
mobile,15/12/2017
camera,15/12/2017
mobile,15/12/2017
mobile,15/12/2017
mobile,25/12/2017
mobile,25/12/2017
camera,25/12/2017
camera,25/12/2017
camera,05/01/2018
laptop,05/01/2018
laptop,05/01/2018
computer,05/01/2018
现在我想根据具有动态重量的日期查找项目频率。 动态权重意味着:最新日期的权重为 1,下一个日期(小于最新日期)的权重应小于最新日期的 10% 等... 例如:
我在上述数据集中有 4 个日期。所以重量应该是:
Date Weight
05/01/2018 1
25/12/2017 .90 (1 - 10% of 1)
15/12/2017 .81 (.90 - 10% of .90)
10/12/2017 0.729 (.81 - 10% of .81)
新的数据集应该如下所示:
item,Date Weight
camera,10/12/2017 0.729
mobile,10/12/2017 0.729
mobile,15/12/2017 0.81
camera,15/12/2017 0.81
mobile,15/12/2017 0.81
mobile,15/12/2017 0.81
mobile,25/12/2017 0.90
mobile,25/12/2017 0.90
camera,25/12/2017 0.90
camera,25/12/2017 0.90
camera,05/01/2018 1.0
laptop,05/01/2018 1.0
laptop,05/01/2018 1.0
computer,05/01/2018 1.0
【问题讨论】:
-
这是什么日期:
25/15/2017?而这个15/15/2017? -
在索要代码之前先尝试一下。查找
dplyr并尝试group_by使用date作为标准...但首先您需要将您的日期转换为您拥有15/15/2017 的真实日期字段...R 不会将其识别为日期....它可以将其视为分类数据,但我仍然会担心您的数据是如何读入的...... -
抱歉日期有误,我更正了。日期为 mm/dd/yyyy 格式。
标签: r