【发布时间】:2013-11-27 20:39:20
【问题描述】:
我有一个包含几列的 pandas 数据框。我有工作日的日期,不包括节假日和其他一些随机漏洞。是否有一种插值方法来填补这些空白并获取所有工作日的数据帧?
【问题讨论】:
我有一个包含几列的 pandas 数据框。我有工作日的日期,不包括节假日和其他一些随机漏洞。是否有一种插值方法来填补这些空白并获取所有工作日的数据帧?
【问题讨论】:
你可以使用 DataFrame 的 reindex() 方法:
x = pd.date_range('2013-01-01','2013-01-07',freq='D')
y = range(7)
df=pd.DataFrame(index=x,data=y,columns=['value'])
要添加缺失的日期(如假期),您需要重新索引它:
x2= pd.date_range('2013-01-01','2013-01-07',freq='4H')
df2=df.reindex(x2)
然后您可以使用 Series 的 interpolate() 方法填充值中的空白(可以使用不同的插值方法):
df2.value=df2.value.interpolate(method='linear')
【讨论】: