【发布时间】:2015-03-10 22:47:24
【问题描述】:
我有一个看起来像这样的系列:
delivery
2007-04-26 706 23
2007-04-27 705 10
706 1089
708 83
710 13
712 51
802 4
806 1
812 3
2007-04-29 706 39
708 4
712 1
2007-04-30 705 3
706 1016
707 2
...
2014-11-04 1412 53
1501 1
1502 1
1512 1
2014-11-05 1411 47
1412 1334
1501 40
1502 433
1504 126
1506 100
1508 7
1510 6
1512 51
1604 1
1612 5
Length: 26255, dtype: int64
查询在哪里:df.groupby([df.index.date, 'delivery']).size()
每天,我需要提取数量最多的交货单号。我觉得会是这样的:
df.groupby([df.index.date, 'delivery']).size().idxmax(axis=1)
但是,这只会返回整个数据帧的 idxmax;相反,我需要每天的二级 idmax(不是日期,而是交货编号),而不是整个数据帧(即它返回一个向量)。
关于如何实现这一点的任何想法?
【问题讨论】:
-
与论坛网站不同,我们不使用“谢谢”、“任何帮助表示赞赏”或Stack Overflow 上的签名。请参阅“Should 'Hi', 'thanks,' taglines, and salutations be removed from posts?.
标签: python pandas multi-index