【发布时间】:2020-10-05 17:04:34
【问题描述】:
我有名为“计划休假”的数据,其中包括“开始日期”、“结束日期”、“用户 ID”和“休假类型”。
我希望能够根据“用户 ID”创建一个新的数据框,显示开始日期和结束日期之间的所有天数。
到目前为止,我只能创建一个 date_list,它提供了开始日期和结束日期之间的日期范围,但我找不到为每个“用户 ID”和“休假类型”包含此日期的方法。
这是我当前的功能:
def datesplit(data):
x = pd.DataFrame(columns=['Date'])
for i in plannedleave.iterrows():
start = data['Start Date'][i]
end = data['End Date'][i]
date_list = [start + dt.timedelta(days=x) for x in range((end-start).days)]
x.append(date_list)
return x
>>> datesplit(plannedleave)
>>> Value Error: Can only Tuple-index with a MultiIndex
数据如下所示:
>>> plannedleave.dtypes
>>>
Employee ID int64
First Name object
Last Name object
Leave Type object
Start Date datetime64[ns]
End Date datetime64[ns]
dtype: object
如果您能在这里找到解决方案,我将永远感激不尽! :-)
【问题讨论】:
-
确定还需要什么其他信息?
标签: python pandas numpy datetime data-science