【发布时间】:2020-10-06 03:21:15
【问题描述】:
给定以下数据表
DT = dt.Frame({'A':['A','A','A','B','B','B'],
'B':['a','a','b','a','a','a'],
})
我想创建列“C”,它对列 A 和 B 中每个组内的行进行编号,如下所示:
A B C
0 A a 1
1 A a 2
2 A b 1
3 B a 1
4 B a 2
5 B a 3
根据this thread 对于 pandas cumcount() 或 rank() 将是选项,但它似乎没有为 pydatatable 定义:
DT = DT[:, f[:].extend({'C': cumcount()}),by(f.A,f.B)]
DT = DT[:, f[:].extend({'C': rank(f.B)}),by(f.A,f.B)]
a) 如何对组内的行进行编号?
b) 是否有包含 pydatatable 所有当前可用功能的综合资源?
【问题讨论】:
标签: python py-datatable