【发布时间】:2015-10-10 21:34:01
【问题描述】:
我想将两个数据框合并在一起,但根据某些逻辑添加一列。我的数据框的简化示例如下:
DF_1:
domain ttl nameserver file_date
fakedomain.com 86400 ns1.fakedomain.com 8/8/2008
fakedomainz.com 86400 ns1.fakedomainz.com 8/8/2008
DF_2:
domain ttl nameserver file_date
fakedomain.com 86400 ns1.fakedomain.com 9/8/2008
fakedomainz.com 86400 ns1.fakedomainz.com 9/8/2008
我想要做的是将这两个数据框合并成一个数据框,如下所示:
DF_2:
domain ttl nameserver first seen last seen
fakedomain.com 86400 ns1.fakedomain.com 8/8/2008 9/8/2008
fakedomainz.com 86400 ns1.fakedomainz.com 8/8/2008 9/8/2008
我找不到合并它们并保留日期的方法。我还想确保日期在正确的字段中。重要的是要注意我正在从文件名中提取的正则表达式创建日期。我还将随着时间的推移连续运行这个脚本,所以第一次看到的日期只会在其他事情发生变化时发生变化,例如域更改其名称服务器。
我能想到的唯一方法是将它们与重命名的日期列合并,然后循环遍历整个数据框,对日期进行适当的排序,但这似乎效率低下。
【问题讨论】: