【发布时间】:2020-04-28 09:57:07
【问题描述】:
我需要计算每个卖家 ID 的期间中位数(参见下面的简化模型)。问题是我无法构造 ORM 查询。
型号
class MyModel:
period = models.IntegerField(null=True, default=None)
seller_ids = ArrayField(models.IntegerField(), default=list)
aux = JSONField(default=dict)
查询
queryset = (
MyModel.objects.filter(period=25)
.annotate(seller_id=Func(F("seller_ids"), function="unnest"))
.values("seller_id")
.annotate(
duration=Cast(KeyTextTransform("duration", "aux"), IntegerField()),
median=Func(
F("duration"),
function="percentile_cont",
template="%(function)s(0.5) WITHIN GROUP (ORDER BY %(expressions)s)",
),
)
.values("median", "seller_id")
)
ArrayField aggregation (seller_id) source
我认为我需要做的是以下几行
select t.*, p_25, p_75
from t join
(select district,
percentile_cont(0.25) within group (order by sales) as p_25,
percentile_cont(0.75) within group (order by sales) as p_75
from t
group by district
) td
on t.district = td.district
Python 3.7.5、Django 2.2.8、Postgres 11.1
【问题讨论】:
-
澄清一下,您是在使用 django 和 SQLServer 吗?
-
@ivissani 问题下方有一个
postgresql标签,所以没有。 -
是的......对此感到抱歉
-
你有什么错误?
-
那么你的问题是什么?您显示的查询有什么问题?您是尝试使用 ORM 还是?
标签: python django postgresql statistics subquery