【发布时间】:2018-04-25 01:28:57
【问题描述】:
我目前有一个通过抓取谷歌新闻标题创建的数据框。我的一个专栏是“时间”,它指的是一篇文章的发表时间。
很遗憾,对于最近的文章,Google 新闻使用“相对”日期,例如 6 小时前或 1 天前,而不是 2017 年 11 月 1 日。
我真的想将这些相对日期转换为与其他条目一致(例如,他们也说 2017 年 11 月 12 日),但我什至不知道从哪里开始。
我的想法是创建一个代表今天日期的变量,然后通过数据框搜索与我的格式不匹配的内容,然后用当前日期减去这些相对时间。我还必须为“几小时前”的内容制作某种过滤器,并让它们与当前日期相同。
我并不是真的想要一个解决方案,而是想大致了解要阅读什么来尝试解决这个问题。我应该尝试使用 numpy 吗?
一些行的例子:
Publication Time Headline
0 The San Diego Union-Tribune 6 hours ago I am not opposed to new therapeutic modalities...
1 Devon Live 13 hours ago If you're looking for a bargain this Christmas...
15 ABS-CBN News 1 day ago Now, Thirdy has a chance to do something that ...
26 New York Times Nov 2, 2017 Shepherds lead their sheep through the centre ...
【问题讨论】:
-
请添加示例数据框
-
抱歉 - 刚刚编辑!
-
让“几小时前”等于当前日期,如果它回到昨天,会给你带来麻烦。最好使用您为所有情况描述的方法转换为日期时间格式。
-
哦...你是对的。这会产生一些问题。我想我需要知道现在的时间和日期然后减去
标签: python pandas datetime dataframe