【发布时间】:2017-12-15 01:11:36
【问题描述】:
我确实有一个包含两列的“input.csv”文件,即“start_date”和“end_date”。我必须在不使用循环的情况下添加日期之间的持续时间列。我试过下面的代码。
import pandas as pd
from datetime import datetime
data = pd.read_csv('data/input.csv')
# converting each data field into date format
data['start_date'] = map(lambda t:datetime.strptime(t,'%Y%M%d'), data.start_date.values)
data['end_date'] = map(lambda t:datetime.strptime(t,'%Y%M%d'), data.end_date.values)
# evaluating the duration
data['duration'] = data.end_date.values - data.start_date.values
显示如下错误
TypeError: unsupported operand type(s) for -: 'map' and 'map'
最初的日期格式是字符串格式的 YYYYMMDD,如 20170516 20180931 等。 我尝试了一些替代方法,但没有奏效。
【问题讨论】:
标签: python python-3.x pandas