【问题标题】:Django ORM: is it possible to inject subqueries?Django ORM:是否可以注入子查询?
【发布时间】:2015-03-28 16:28:17
【问题描述】:

我有一个看起来像这样的 Django 模型:

class Result(models.Model):
    date = DateTimeField()
    subject = models.ForeignKey('myapp.Subject')
    test_type = models.ForeignKey('myapp.TestType')
    summary = models.PositiveSmallIntegerField()
    # more fields about the result like its location, tester ID and so on

有时我们想要检索所有测试结果,有时我们只想要每个科目的特定测试类型的最新结果。 This answer 有一些很好的 SQL 选项,可以找到最新的结果。

此外,我们有时希望将结果分成不同的时间段,以便我们可以绘制每天/每周/每月的结果数量。

我们还想过滤各种字段,为了优雅,我想要一个 QuerySet,然后我可以对它进行所有 filter() 调用,并对计数进行注释,而不是进行原始 SQL 调用。

我已经走到这一步了:

qs = Result.objects.extra(select = {
         'date_range': "date_trunc('{0}', time)".format("day"), # Chunking into time buckets
         'rn' : "ROW_NUMBER() OVER(PARTITION BY subject_id, test_type_id ORDER BY time DESC)"})
qs = qs.values('date_range', 'result_summary', 'rn')
qs = qs.order_by('-date_range')

导致以下 SQL:

SELECT (ROW_NUMBER() OVER(PARTITION BY subject_id, test_type_id ORDER BY time DESC)) AS "rn", (date_trunc('day', time)) AS "date_range", "myapp_result"."result_summary" FROM "myapp_result" ORDER BY "date_range" DESC

这有点接近我想要的,但现在我需要以某种方式过滤以仅获取 rn = 1 的行。我尝试在 extra() 中使用“where”字段,这给了我以下 SQL和错误:

SELECT (ROW_NUMBER() OVER(PARTITION BY subject_id, test_type_id ORDER BY time DESC)) AS "rn", (date_trunc('day', time)) AS "date_range", "myapp_result"."result_summary" FROM "myapp_result" WHERE "rn"=1 ORDER BY "date_range" DESC                                                                                                                            ;
ERROR:  column "rn" does not exist

所以我认为找到“rn”的查询需要是一个子查询——但是否有可能以某种方式做到这一点,也许使用 extra()?

我知道我可以使用原始 SQL 做到这一点,但它看起来很丑!我很想找到一个很好的简洁方法,让我有一个可过滤的 QuerySet。

我猜另一种选择是在模型中设置一个字段来指示它是否实际上是该主题的该测试类型的最新结果...

【问题讨论】:

  • 我发现当您尝试获得这种复杂性时,简单地执行原始/直接数据库查询要容易得多。也可以查看 Q() 对象,但不确定在这种情况下会有所帮助。

标签: django postgresql orm


【解决方案1】:

我找到了方法!

qs = Result.objects.extra(where = ["NOT EXISTS(SELECT * FROM myapp_result as T2 WHERE (T2.test_type_id = myapp_result.test_type_id AND T2.subject_id = myapp_result.subject ID AND T2.time > myapp_result.time))"])

这是基于与the answer I referenced earlier 不同的选项。我可以用我想要的任何东西过滤或注释 qs。


顺便说一句,在解决这个问题的过程中,我尝试了这个:

qq = Result.objects.extra(where = ["NOT EXISTS(SELECT * FROM myapp_result as T2 WHERE (T2.test_type_id = myapp_result.test_type_id AND T2.subject_id = myapp_result.subject ID AND T2.time > myapp_result.time))"])
qs = Result.objects.filter(id__in=qq)

Django 会按照您的意愿嵌入子查询:

SELECT ...some fields... FROM "myapp_result" 
WHERE ("myapp_result"."id" IN (SELECT "myapp_result"."id" FROM "myapp_result" 
WHERE (NOT EXISTS(SELECT * FROM myapp_result as T2 
WHERE (T2.subject_id = myapp_result.subject_id AND T2.test_type_id = myapp_result.test_type_id AND T2.time > myapp_result.time))))) 

我意识到这有比我需要的更多的子查询,但我在这里注意到它,因为我可以想象知道您可以用另一个查询集过滤一个查询集并且 Django 在嵌入子查询(而不是执行它并嵌入返回的值,这将是可怕的。)

【讨论】:

    猜你喜欢
    • 2020-05-26
    • 2014-05-19
    • 2022-01-21
    • 1970-01-01
    • 2014-09-04
    • 2020-01-26
    • 2018-08-26
    • 2012-04-02
    • 2011-07-06
    相关资源
    最近更新 更多