【发布时间】:2017-06-15 17:25:20
【问题描述】:
我正在使用 Pandas 处理庞大的时间序列数据集。如果两个连续索引之间的差异大于 5,我想在数据框中的行之间添加行。
实际:
a result
Date
1497544649 1 1.0
1497544652 9 1.0
1497544661 9 NaN
预期:
a result
Date
1497544649 1 1.0
1497544652 9 1.0
1497544657 9 0
1497544661 9 NaN
我在索引上使用了 diff() 来获取两个连续索引之间的差异,但如果差异大于 5,我不确定如何插入记录。
import pandas as pd
df = pd.DataFrame([{"Date": 1497544649,"a":1, "result": 1},
{"Date": 1497544652,"a": 9, "result": 1},
{"Date": 1497544661,"a": 9, "result": 1}])
df.set_index("Date", inplace=True)
df.index.to_series().diff().fillna(0).to_frame("diff")
任何关于如何实现这一点的指针将不胜感激
谢谢
【问题讨论】:
标签: python python-2.7 pandas dataframe