【发布时间】:2013-05-03 10:31:19
【问题描述】:
pandas factorize 函数将系列中的每个唯一值分配给从 0 开始的顺序索引,并计算每个系列条目所属的索引。
我想在多个列上完成 pandas.factorize 的等效操作:
import pandas as pd
df = pd.DataFrame({'x': [1, 1, 2, 2, 1, 1], 'y':[1, 2, 2, 2, 2, 1]})
pd.factorize(df)[0] # would like [0, 1, 2, 2, 1, 0]
也就是说,我想确定数据帧的几列中每个唯一的值元组,为每个值分配一个顺序索引,并计算数据帧中的每一行属于哪个索引。
Factorize 仅适用于单列。 pandas中是否有多列等效函数?
【问题讨论】:
-
你的预期输出是什么?
-
评论中的列表 -- 每个不同 (x, y) 值的唯一顺序索引
标签: python pandas enumeration data-cleaning