【问题标题】:Finding duration between two dates in python using pandas使用熊猫在python中查找两个日期之间的持续时间
【发布时间】:2017-12-15 01:11:36
【问题描述】:

我确实有一个包含两列的“input.csv”文件,即“start_date”和“end_date”。我必须在不使用循环的情况下添加日期之间的持续时间列。我试过下面的代码。

import pandas as pd
from datetime import datetime

data = pd.read_csv('data/input.csv')

# converting each data field into date format
data['start_date'] = map(lambda t:datetime.strptime(t,'%Y%M%d'), data.start_date.values)
data['end_date'] = map(lambda t:datetime.strptime(t,'%Y%M%d'), data.end_date.values)

# evaluating the duration
data['duration'] = data.end_date.values - data.start_date.values

显示如下错误

TypeError: unsupported operand type(s) for -: 'map' and 'map'

最初的日期格式是字符串格式的 YYYYMMDD,如 20170516 20180931 等。 我尝试了一些替代方法,但没有奏效。

【问题讨论】:

    标签: python python-3.x pandas


    【解决方案1】:
    data['end_date'] = pd.to_datetime(data['end_date'], format='%Y%m%d')
    data['start_date'] = pd.to_datetime(data['start_date'], format='%Y%m%d')
    data["duration"] = data['end_date'] - data['start_date']
    

    这行得通。我使用了其他 cmets 的参考资料。

    【讨论】:

      【解决方案2】:

      我昨天正在做这个!干杯。

      data['end_date'] = pd.to_datetime(data['end_date'])
      data['start_date'] = pd.to_datetime(data['start_date'])
      data["duration"] = data['end_date'] - data['start_date']
      

      to_datetime 相当健壮,可以推断格式。

      【讨论】:

      • 将 12/08/2004 的日期转换为 1970-01-01 00:00:00.020040812,即 20140812,我提到它是给定的日期格式。
      • 使用 format('date_format') 参数是 to_datetime 函数工作
      【解决方案3】:

      更简单的是,您可以这样做: data["duration"] = data['end_date'] - data['start_date'] 新的“持续时间”列的类型是 Timedelta。获取天数: data["duration"][0].days 返回天数,输入int

      【讨论】:

        猜你喜欢
        • 2018-12-21
        • 2012-09-28
        • 2017-09-07
        • 1970-01-01
        • 2018-11-23
        • 2023-03-25
        • 1970-01-01
        • 2017-05-02
        相关资源
        最近更新 更多