【发布时间】:2019-04-07 19:39:39
【问题描述】:
我有一个这样的熊猫数据框:
second block
0 1 a
1 2 b
2 3 c
3 4 a
4 5 c
这是一个顺序数据,我想得到一个新列,它是当前块与下一次重复之间的时间差。
second block freq
0 1 a 3 //(4-1)
1 2 b 0 //(not repeating)
2 3 c 2 //(5-3)
3 4 a 0 //(not repeating)
4 5 c 0 //(not repeating)
我试图获取唯一的块列表。然后是一个 for 循环,如下所示。
for i in unique_block:
df['freq'] = df['timestamp'].shift(-1) - df['timestamp']
我不知道如何为行索引 1、3、4 获取 0,因为数据框太大。这效率不高。这不起作用。
谢谢。
【问题讨论】:
标签: sql python-3.x pandas