【发布时间】:2023-03-21 20:26:01
【问题描述】:
我正在使用 Pandas 作为数据库替代品,因为我有多个数据库(Oracle、SQL Server 等),并且我无法将命令序列转换为 SQL 等效项。
我在 DataFrame 中加载了一个包含一些列的表:
YEARMONTH, CLIENTCODE, SIZE, etc., etc.
在 SQL 中,计算每年不同客户的数量是:
SELECT count(distinct CLIENTCODE) FROM table GROUP BY YEARMONTH;
结果是
201301 5000
201302 13245
如何在 Pandas 中做到这一点?
【问题讨论】:
-
我已经完成了 table.groupby(['YEARMONTH'])['CLIENTCODE'].unique() 并带有由 YEARMONTH 索引的两个系列和所有唯一值。如何计算每个系列的值的数量?
-
对于某些人来说,
value_counts可能是您正在寻找的答案:pandas.pydata.org/pandas-docs/stable/generated/…
标签: python pandas count group-by distinct