【发布时间】:2021-06-04 16:48:44
【问题描述】:
我有一个数据框,其中包含来自 csv 文件的日期。我需要在列中的日期与“6/'1/2021”日期之间添加一个实际天数差异的列。我用过
Act_Days.append((pd.to_datetime(df.date[t])-
pd.to_datetime(df.settle_date))/np.timedelta64(1, 'D'))
此代码有效,但此代码需要很长时间来计算,因为数据集有大约 30K 行,我假设它是逐行计算的。是不是还是要提高速度。我听说使用 numpy 数组比使用 pandas 系列要快得多,但是当我尝试将日期列转换为 numpy 数组时,python 不会减去 2021 年 6 月 1 日的日期。它显示一个错误:
dates=output.date.to_numpy()
np.datetime64(dates)-np.timedelta64('2021-6-1', 'D')
--------------------------------------------------------------------------
ValueError Traceback (most recent call last)
<ipython-input-9-05fdef3e68dd> in <module>
1 dates=output.date.to_numpy()
----> 2 np.datetime64(dates)-np.timedelta64('2021-6-1', 'D')
ValueError: Could not convert object to NumPy datetime
【问题讨论】:
-
"2021-6-1" 不是时间增量。你想减去两个日期吗?在这种情况下,它们都需要是
datetime64值,并且结果是`timedelta64。 -
你能添加更多代码吗,例如显示您为什么使用索引
[t]?一般说明;由于 pandas 在后台使用 numpy 数组,我怀疑您是否会从更改数据类型中获得很多收益 - 您可能会从重构代码中受益更多。 -
t 代表日期列表中的日期。日期来自 csv 文件。我将 pandas 列日期转换为列表并应用 Act_Days= [] for t in range(len(output)): Act_Days.append((pd.to_datetime(df.date[t])- pd.to_datetime(df.settle_date)) /np.timedelta64(1, 'D'))
标签: python numpy datetime python-datetime