【发布时间】:2015-07-28 17:07:25
【问题描述】:
我目前正在使用 CodeIgniter 框架开发一个 PHP/MySQL 应用程序。
我有一个相当长的查询导致了一些问题。将日期范围更改为更长的时间段(例如 30 天,而不是默认的 7 天)时会出现问题。查询时间大幅增加:1/2 秒到 90 秒,但我只能推测这是因为数据量的增加。
在我粘贴查询之前,以下是对表格的简要说明:
- flagged_cases:独特案例列表(主表) - 352 行
- data_sources:数据源列表,每个案例使用外键引用此表 - 20 行
- matches: 行文本匹配一个案例(一对多关系,即一个案例,多个匹配) - 22000 行
- flagged_cases_keywords_hits:将案例 ID 映射到关键字(和点击数) - 2500 行
- 关键字:关键字列表 - 121 行
- reviewed_state: 3 个州的 id/description,只检查这个查询的 review_state = 1 - 3 行
以下是查询,我意识到它相当大,但我认为索引肯定存在潜在问题,不幸的是我不具备完全排除故障的知识,因此不胜感激。
SELECT flagged_cases.id,
data_source_id,
title,
fetch_date,
publish_date,
case_id,
case_title,
case_link,
relevance_score,
(
SELECT group_concat(match_string_highlighted ORDER BY matches.id SEPARATOR "")
FROM matches
WHERE flagged_case_id=flagged_cases.id) AS all_matches,
reviewed_state_id,
(
SELECT group_concat(concat(k.keyword, " ", "x", cast(kh.hits AS CHAR), "") SEPARATOR "")
FROM flagged_cases_keywords_hits kh
JOIN keywords k
ON kh.keyword_id = k.id
WHERE kh.flagged_case_id = flagged_cases.id
ORDER BY k.weighting DESC) AS hitcount
FROM flagged_cases
JOIN data_sources
ON flagged_cases.data_source_id = data_sources.id
JOIN reviewed_state
ON flagged_cases.reviewed_state_id = reviewed_state.id
LEFT JOIN matches
ON flagged_cases.id = matches.flagged_case_id
WHERE reviewed_state_id = 1
AND data_source_id IN('1',
'3',
'4',
'5',
'6',
'7',
'8',
'9',
'10',
'11',
'12',
'13',
'14',
'15',
'16',
'17',
'18',
'19',
'20')
AND fetch_date >= '2015-05-10 00:00:00'
AND fetch_date <= '2015-05-17 23:59:59'
GROUP BY flagged_cases.id
ORDER BY title DESC
LIMIT 10;
作为 SHOW FULL PROCESSLIST 的结果,我可以看到查询保持在“发送数据”状态,从一些研究中我可以看到基本上是 MySQL 获取和选择数据,所以我只能假设必须有一个丢失的索引或导致速度变慢的原因。
我也得到了查询的EXPLAIN,如下:
+----+--------------------+----------------+--------+----------------------------------+-----------------+---------+----------------------------+------+----------------------------------------------+
| id | select_type | table | type | possible_keys | key | key_len | ref | rows | Extra |
+----+--------------------+----------------+--------+----------------------------------+-----------------+---------+----------------------------+------+----------------------------------------------+
| 1 | PRIMARY | reviewed_state | const | PRIMARY | PRIMARY | 4 | const | 1 | Using index; Using temporary; Using filesort |
| 1 | PRIMARY | data_sources | range | PRIMARY | PRIMARY | 4 | NULL | 19 | Using where |
| 1 | PRIMARY | flagged_cases | ref | data_source_id,reviewed_state_id | data_source_id | 4 | proactive.data_sources.id | 14 | Using where |
| 1 | PRIMARY | matches | ref | flagged_case_id | flagged_case_id | 4 | proactive.flagged_cases.id | 32 | Using index |
| 3 | DEPENDENT SUBQUERY | kh | ref | flagged_case_id,keyword_id | flagged_case_id | 5 | func | 3 | Using where; Using temporary |
| 3 | DEPENDENT SUBQUERY | k | eq_ref | PRIMARY | PRIMARY | 4 | proactive.kh.keyword_id | 1 | Using where |
| 2 | DEPENDENT SUBQUERY | matches | ref | flagged_case_id | flagged_case_id | 4 | func | 32 | |
+----+--------------------+----------------+--------+----------------------------------+-----------------+---------+----------------------------+------+----------------------------------------------+
非常感谢任何帮助/建议/提示! :)
【问题讨论】:
-
你能在上面列出的每个表中添加多少行吗?快速浏览一下查询,其中包含连接的嵌套选择(?)肯定是您的瓶颈......
-
感谢您的快速回复。已按要求添加。是的,这是我怀疑的,但时差的疯狂增加似乎很奇怪。我认为这可能与 group_concat 有关,但不确定...:S
-
刚刚测试并删除了第一个嵌套选择(匹配)并根除问题,因此它似乎在某种程度上与此相关。嗯!
-
为什么不去掉 groupconcat 部分,看看它是否是长查询的唯一响应
-
@jollarvia,见上文。我刚刚删除了它进行测试,它似乎确实是负责任的。但不幸的是,这是必需的,我不明白为什么会导致速度变慢?
标签: php mysql sql codeigniter sqlperformance