【发布时间】:2020-11-03 16:17:40
【问题描述】:
我有一个 Pandas 数据框,其中包含按街道和城市分组的 16,000 个地址。我需要找到连续地址范围之间的最小值、最大值和步长。
例如,10,12,14,16 Main street。最小值为 10,最大值为 16,步长为 2。
问题是范围并不总是那么简单,有些不是真正的地址范围,而是沿街道分布的地址。
例如,4456、5567、6678,主要街道。
我希望能够识别连续范围及其最小值、最大值和步长,并将那些不连续的范围分成单独的行。
我已经知道了最小值和最大值,但我不知道如何找到顺序地址。
df['street_min']=[min(x) for x in df['Street Number'].tolist()]
df['street_max']=[max(x) for x in df['Street Number'].tolist()]
样本数据
ID Street_number Street_Name
1 [10,12,14,16] Main St
2 [4456, 5567, 6657] First St (These 3 would become 3 unique records)
3 [60,65,70, 100] Second St (This example would keep 60-70 and remove 100 to another row)
【问题讨论】:
标签: python pandas range sequence street-address