【发布时间】:2020-10-08 10:35:32
【问题描述】:
我得到以下pandas.DataFrame,其中value 列是输入数据,group 是所需输出。
import pandas as pd
import numpy as np
df = pd.DataFrame({'value': [0.1, 0.2, np.nan, 0.2, 0.3, 0.5, np.nan, 0.1],
'group': [1, 1, np.nan, 2, 2, 2, np.nan, 3]})
我想为每个连续数字段分配一个唯一的 ID,它们由 np.nan 分隔。为此我可能需要一些聚类方法,但我还找不到任何 pandas 函数来实现这一点。
【问题讨论】:
-
总是只有一个 NaN 行?不是连续 2 次吗?
-
也可能不止 1 个,甚至连续 100 多个。感谢您指出这一点!
标签: python-3.x pandas numpy dataframe