【发布时间】:2017-05-25 04:51:31
【问题描述】:
Pandas 中是否有与 SQL 的窗口函数等效的惯用方法?例如,在 Pandas 中编写等价物的最紧凑的方法是什么?:
SELECT state_name,
state_population,
SUM(state_population)
OVER() AS national_population
FROM population
ORDER BY state_name
还是这个?:
SELECT state_name,
state_population,
region,
SUM(state_population)
OVER(PARTITION BY region) AS regional_population
FROM population
ORDER BY state_name
【问题讨论】:
-
你能提供一个样本数据集和想要的数据集吗?
-
@JackManey,AFAIK 不太一样 - 至少对于提到的 SQL...
-
@JackManey Pandas 文档中的窗口函数是 SQL 窗口函数所具有的功能的子集。基本上我想做的是在不减少数据帧的情况下计算聚合。
标签: python sql pandas window-functions