【发布时间】:2017-05-19 16:22:21
【问题描述】:
我有两个需要合并的数据框。我要合并的字段是 IP 地址和时间 (%H:%M)。我在 IP 地址字段中寻找完全匹配,但在时间字段中我希望在 5 分钟 (+/-) 内进行模糊匹配。例如,如果我有以下 2 个数据框:
> df1
users1 IPs1 times1
1 user1 192.168.1.1 11:05
2 user2 192.168.1.2 20:31
3 user3 192.168.1.3 01:19
> df2
users2 IPs2 times2
1 userx 192.168.1.2 20:33
2 usery 192.168.1.3 01:19
3 userz 192.168.1.1 11:01
我想合并数据框以显示 user1 与 userz 相关,user2 与 userx 相关,user3 与 usery 相关。我怎么能那样做?使用合并功能,我只会根据确切的时间匹配获得 user3 与 usery 的相关性。
【问题讨论】:
-
您能否在您的问题中添加预期的输出?
-
您能否粘贴
dput(df1)和dput(df2)的输出以获得易于重现的数据?