【发布时间】:2018-03-17 14:17:31
【问题描述】:
我有以下数据框df:
time col_A
0 1520582580.000 79.000
1 1520582880.000 22.500
2 1520583180.000 29.361
3 1520583480.000 116.095
4 1520583780.000 19.972
5 1520584080.000 36.857
6 1520584380.000 15.167
7 1520584680.000 nan
8 1520584980.000 nan
9 1520585280.000 nan
10 1520585580.000 34.500
11 1520585880.000 17.583
12 1520586180.000 nan
13 1520586480.000 48.833
14 1520586780.000 18.806
15 1520587080.000 18.583
col_A 缺少一些数据。我想创建一个col_B,它为每条缺失的记录取前一个值。即
6 1520584380.000 15.167
7 1520584680.000 15.167
8 1520584980.000 15.167
9 1520585280.000 15.167
10 1520585580.000 34.500
11 1520585880.000 17.583
12 1520586180.000 17.583
13 1520586480.000 48.833
和一个col_C,它使用最接近的前后非缺失点进行插值。即
6 1520584380.000 15.167
7 1520584680.000 20.001
8 1520584980.000 24.834
9 1520585280.000 29.667
10 1520585580.000 34.500
11 1520585880.000 17.583
12 1520586180.000 33.208
13 1520586480.000 48.833
除了循环遍历数据帧以逐个记录地进行计算之外,是否有一个内置函数可以用来以优雅的方式实现这一点?谢谢!
【问题讨论】:
标签: python-3.x pandas dataframe