【发布时间】:2016-07-07 01:20:12
【问题描述】:
我的数据框包含一个日期字段,它以字符串格式显示,例如
'2015-07-02T11:22:21.050Z'
我需要过滤日期的 DataFrame 以仅获取上周的记录。 因此,我尝试了一种映射方法,其中我将字符串日期转换为使用 strptime 的日期时间对象:
def map_to_datetime(row):
format_string = '%Y-%m-%dT%H:%M:%S.%fZ'
row.date = datetime.strptime(row.date, format_string)
df = df.map(map_to_datetime)
然后我将过滤器应用为
df.filter(lambda row:
row.date >= (datetime.today() - timedelta(days=7)))
我设法让映射工作,但过滤器失败了
TypeError: 条件应该是字符串或列
有没有办法以一种有效的方式使用过滤,或者我应该改变方法以及如何改变?
【问题讨论】:
标签: python date datetime dataframe pyspark