【问题标题】:SQL - duplicate tags coming back when more than one left joinSQL - 当多个左连接时返回重复标签
【发布时间】:2014-08-11 12:14:04
【问题描述】:

我正在获取一个预订,该预订附有多个链接标签和客户。

有两个中间表用于跟踪其他表之间的关联:bookings(在这种情况下)和tags 表之间的tag_assocs,以及bookingscustomers 表之间的assocs .

SQL(简体):

SELECT
    bookings.id,
    GROUP_CONCAT(tag SEPARATOR "|") AS tags,
    GROUP_CONCAT(customers.id SEPARATOR "|") AS customer_id
FROM bookings
LEFT JOIN tag_assocs ON tag_assocs.item_id = bookings.id && tag_assocs.item_type = "bookings"
LEFT JOIN tags ON tags.id = tag_assocs.tag_id
LEFT JOIN assocs ON assocs.item_id = bookings.id && assocs.item_type = "bookings.customer_id"
LEFT JOIN customers ON customers.id = assocs.foreign_item_id
WHERE bookings.id = "a64l_ku-4af"
GROUP BY bookings.id
ORDER BY bookings.modified desc
LIMIT 20

现在,有问题的预订 (a64l_ku-4af) 只有一个标签 - 在数据库中确认。也就是说,它在tag_assocs 中只有一个条目用于标记some-tag。实际上,这是通过唯一索引阻止重复来强制执行的。但它会回来两次,即

--------------------
| tags             |
--------------------
| some-tag|some-tag|
--------------------

两部分问题:

1) 为什么会这样?

2) 我可以通过将 GROUP_CONCAT(tag ... 更改为 GROUP_CONCAT(DISTINCT tag ...) 来解决此问题,但我觉得这是一个 hack,并没有解决问题的原因。

【问题讨论】:

  • 看看没有GROUP BY和没有GROUP_CONCAT的结果,你就明白了。不:2)不是黑客。每个为已经存在的行生成多行的连接都会在结果集中生成尽可能多的行,并相应地增加标签的出现次数。
  • 感谢您的澄清。
  • @VMai - 我假设 2) 是一个 hack,因为我认为 MySQL 通过首先获取所有行然后删除重复项来处理 DISTINCT。如果是这样,这是我认为应该尽量避免的开销。
  • 是的,我能理解你的推理。我在这一行假设了一些东西。因此,我决定通过一个易于理解的例子来解释它。

标签: mysql sql join tags left-join


【解决方案1】:

让我们用一个例子来解释。假设我们有以下表格:

第 1 部分:原始查询

桌书:

id | book
------------
 1 | Book 1
 2 | Book 2

表格标签:

id | tag
-----------
 1 | Hobby
 2 | Sport
 3 | Work

Table books2tags(用于用适当的标签标记书籍):

book_id | tag_id
----------------
      1 |     1
      1 |     2
      2 |     2
      2 |     3

现在两本书都有两个标签,结果是

SELECT b.book, t.tag FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id

会这样(顺序无关):

book   | tag
---------------
book 1 | Hobby
book 1 | Sport
book 2 | Sport
book 2 | Work

要获取包含每本书标签列表的字符串,我们使用

SELECT b.book, GROUP_CONCAT(t.tag SEPARATOR '|') as tags FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
GROUP BY b.book

结果可能是:

book   | tags
---------------------
book 1 | Hobby|Sport
book 2 | Work|Sport

第 2 部分:加入另一个表

如果我们有另一个包含可选附加信息的表,例如:

id | book_id | example
-------------------------------------
 1 |      1  | 'example information'
 2 |      2  | 'another example'

我们通过 LEFT JOIN 获得此附加信息:

SELECT b.book, t.tag, e.example FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
LEFT JOIN example e ON b.id = e.book_id

结果将是:

book   | tag     | example
----------------------------
book 1 | Hobby   | example information
book 1 | Hobby   | another example
book 1 | Sport   | example information
book 1 | Sport   | another example
book 2 | Sport   | NULL
book 2 | Work    | NULL

您会看到,原始查询中第 1 册的每一行在结果中的出现频率与我们新连接的表示例中的匹配行一样多。如果我们使用旧查询按书籍获取标签,但使用添加的左连接,我们将通过

SELECT b.book, GROUP_CONCAT(t.tag SEPARATOR '|') as tags FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
LEFT JOIN example e ON b.id = e.book_id
GROUP BY b.book

book   | tags
---------------------
book 1 | Hobby|Hobby|Sport|Sport
book 2 | Work|Sport

这是因为现在有两行带有标签“爱好”和两行带有标签“运动”。但是为了得到标签列表,我们使用 DISTINCT 得到正确的结果。这不是黑客攻击:

SELECT b.book, GROUP_CONCAT(DISTINCT t.tag SEPARATOR '|') as tags FROM books b
INNER JOIN books2tags bt ON b.id = bt.book_id
INNER JOIN tags t ON bt.tag_id = t.id
LEFT JOIN example e ON b.id = e.book_id
GROUP BY b.book

book   | tags
---------------------
book 1 | Hobby|Sport
book 2 | Work|Sport

结论

我想我通过加入另一个表格作为问题第 1 部分的答案,证明了为什么标签会重复,并且可以向您保证,您的解决方案不是黑客,但实际上是解决此问题的正确解决方案。

也看看this demo

【讨论】:

  • 哇,很好的答案。感谢您竭尽全力帮助我。体现了最好的 SO。 +1 并被接受。
猜你喜欢
  • 2014-10-08
  • 2013-04-03
  • 1970-01-01
  • 1970-01-01
  • 2021-03-07
  • 2021-01-04
  • 1970-01-01
  • 1970-01-01
  • 1970-01-01
相关资源
最近更新 更多