【问题标题】:Mysql make 3 queries in 1 and improve performanceMysql 3 查询合1 提升性能
【发布时间】:2018-01-06 16:55:52
【问题描述】:

我正在尝试创建报告并运行 4 个查询,但性能太差了。

我正在使用 2 张桌子

这个有 2500 件物品

CREATE TABLE `bolt_accounts` (
  `id` int(11) NOT NULL,
  `slug` varchar(128) COLLATE utf8_unicode_ci NOT NULL,
  `datecreated` datetime NOT NULL,
  `datechanged` datetime NOT NULL,
  `datepublish` datetime DEFAULT NULL,
  `datedepublish` datetime DEFAULT NULL,
  `username` varchar(32) COLLATE utf8_unicode_ci DEFAULT '',
  `ownerid` int(11) DEFAULT NULL,
  `status` varchar(32) COLLATE utf8_unicode_ci NOT NULL,
  `templatefields` longtext COLLATE utf8_unicode_ci COMMENT '(DC2Type:json_array)',
  `managerid` varchar(128) COLLATE utf8_unicode_ci DEFAULT '',
  `parentid` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `name` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `qualify` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `regdate` date DEFAULT NULL,
  `city` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `phone` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `passhash` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `cookie` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `resettoken` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `block` tinyint(1) NOT NULL DEFAULT '0',
  `blocksms` tinyint(1) NOT NULL DEFAULT '0',
  `birthday` date DEFAULT NULL
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;


ALTER TABLE `bolt_accounts`
  ADD PRIMARY KEY (`id`),
  ADD KEY `IDX_9C703491989D9B62` (`slug`),
  ADD KEY `IDX_9C703491AFBA6FD8` (`datecreated`),
  ADD KEY `IDX_9C703491BE74E59A` (`datechanged`),
  ADD KEY `IDX_9C703491A5131421` (`datepublish`),
  ADD KEY `IDX_9C703491B7805520` (`datedepublish`),
  ADD KEY `IDX_9C7034917B00651C` (`status`),
  ADD KEY `IDX_9C703491C13A5CC2` (`managerid`),
  ADD KEY `IDX_9C703491856A684C` (`parentid`(255)),
  ADD KEY `IDX_9C7034911E6AC3AE` (`regdate`),
  ADD KEY `IDX_9C7034914709B432` (`birthday`);

还有一个包含所有统计信息的,其中包含超过 1 400 000 个项目

CREATE TABLE `bolt_statistics` (
  `id` int(11) NOT NULL,
  `slug` varchar(128) COLLATE utf8_unicode_ci NOT NULL,
  `datecreated` datetime NOT NULL,
  `datechanged` datetime NOT NULL,
  `datepublish` datetime DEFAULT NULL,
  `datedepublish` datetime DEFAULT NULL,
  `username` varchar(32) COLLATE utf8_unicode_ci DEFAULT '',
  `ownerid` int(11) DEFAULT NULL,
  `status` varchar(32) COLLATE utf8_unicode_ci NOT NULL,
  `templatefields` longtext COLLATE utf8_unicode_ci COMMENT '(DC2Type:json_array)',
  `managerid` varchar(256) COLLATE utf8_unicode_ci DEFAULT '',
  `statdate` datetime DEFAULT NULL,
  `lopv` double NOT NULL DEFAULT '0',
  `gope` double NOT NULL DEFAULT '0',
  `gopv` double NOT NULL DEFAULT '0'
) ENGINE=InnoDB DEFAULT CHARSET=utf8 COLLATE=utf8_unicode_ci;

ALTER TABLE `bolt_statistics`
  ADD PRIMARY KEY (`id`),
  ADD KEY `IDX_BE38DFD2989D9B62` (`slug`),
  ADD KEY `IDX_BE38DFD2AFBA6FD8` (`datecreated`),
  ADD KEY `IDX_BE38DFD2BE74E59A` (`datechanged`),
  ADD KEY `IDX_BE38DFD2A5131421` (`datepublish`),
  ADD KEY `IDX_BE38DFD2B7805520` (`datedepublish`),
  ADD KEY `IDX_BE38DFD27B00651C` (`status`),
  ADD KEY `IDX_BE38DFD2C13A5CC2` (`managerid`(255));

所以问题是,当我将这些表连接在一起时,性能会变低...

SELECT ba.managerid,name,replace(phone,'+','') as phone,passhash, date_format(ba.datepublish,'%d.%m.%Y %H:%i') as datepublish, max(bs.lopv) as lopv, max(bs.gopv) as gopv 
FROM bolt_accounts ba 
LEFT JOIN bolt_statistics bs ON ba.managerid=bs.managerid 
WHERE (parentid='007-645930') 
AND (date(ba.datechanged)=('2018-01-06')) 
AND (date(bs.datecreated)=('2018-01-06')) 
GROUP BY ba.managerid 
ORDER BY gopv desc 

此查询将运行 360-450 毫秒 ~0.3 秒。 它将返回所有具有 parentid=007-645930 的 managerid 类似的东西:

managerid
007-663360
007-677590
007-697191
007-1526400
007-1155884
007-1842169
077-1564660
007-1883072
007-777143
007-1865946
007-1875083
007-1753407
007-1322124
007-1100631
007-1603795
007-1171656
007-1890892
007-1166247
007-1564611
007-1882959
007-1145375
007-1878383
007-1128857
007-1762655
007-1346877
007-1714252
007-1709538
007-1319044
007-1698517
007-1316756
007-1679094
007-1298984
007-1905146
007-1675451
007-1287166
007-1899632
007-1629224
007-1190862
007-1894824
007-1616741
007-1171665
007-1894330

我从该列表中取出 1 个 id,然后运行 ​​3 个查询

SELECT max(s.lopv) as lopv, max(s.gopv) as gopv 
FROM bolt_statistics s WHERE (managerid='007-663360') 
AND (datecreated between DATE_FORMAT('2018-01-06' - INTERVAL 1 MONTH,'%Y-%m-28 23:00:00') and DATE_FORMAT(LAST_DAY('2018-01-06' - INTERVAL 1 MONTH),'%Y-%m-%d 23:59:59'))

执行时间20-25ms

SELECT max(s.lopv) as lopv, max(s.gopv) as gopv 
FROM bolt_statistics s 
WHERE (managerid='007-663360') 
AND (date(datecreated) = date('2018-01-06' -INTERVAL 1 day))

执行时间15-20ms

SELECT max(s.lopv) as lopv, max(s.gopv) as gopv 
FROM bolt_statistics s 
WHERE (managerid='007-663360') 
AND (date(datecreated) = date('2018-01-06' -INTERVAL 2 day))

执行时间15-20ms

所有执行结束后,需要 1.5 秒(1500 毫秒)来呈现 php 报告。

我知道,我不太擅长 mysql 查询 ;)) 但我想知道,如何提高查询的性能?

如果我将所有这些查询合并到 1 中会更快吗?

【问题讨论】:

  • 你有很多单列索引。复杂查询需要复合/复合索引才能高效运行。
  • 关于单列索引 ADD KEY IDX_BE38DFD2989D9B62 (slug), ADD KEY IDX_BE38DFD2AFBA6FD8 (datecreated), ADD KEY IDX_BE38DFD2BE74E59A (datechanged), ADD KEY IDX_BE38DFD2A5131421 (datepublish), ADD KEY IDX_BE38DFD2B7805520 (datedepublish), ADD KEY IDX_BE38DFD27B00651C (status), 这种类型的索引是通过bolt cms控制的,所以我不能删除它们;(复合呢索引,我不明白?
  • 好的,我得到了 coposite 的,所以问题是:拥有一个复杂的索引(managerid,datecreated)是个好主意吗?
  • 提高性能是个好“主意”。
  • @PaulSpiegel 谢谢。添加复合\复杂索引帮助我将性能提高了 3 倍。

标签: mysql performance join


【解决方案1】:

这些字段真的需要完整的 256 个字符吗?把它们改成合理的数字,然后去掉ADD KEY IDX_BE38DFD2C13A5CC2 (managerid(255))上的前缀等(前缀索引通常没用。)

不要在函数中隐藏列 (date(ba.datechanged))。而是:

AND ba.datechanged >= '2018-01-06' - INTERVAL 2 DAY
AND ba.datechanged  < '2018-01-06' - INTERVAL 3 DAY

注意:无论datechanged 是什么数据类型——DATEDATETIMEDATETIME(6)TIMESTAMP,上述模式都可以正常工作。优化器可以使用诸如 ...

之类的索引

之后,使用复合 INDEX(managerid, datecreated) 以显着提高性能。

使用派生表代替LEFT JOIN 加上GROUP BY。这可能会大大提高速度。

status 是什么?为什么VARCHAR(32)?如果它是一个简单的、低基数的值,不要单独索引它;该索引不会被使用。

(可能有更多提示,但这应该可以帮助您入门。)

【讨论】:

  • Mb 我忘了说,我不使用这些字段,它们是由 Bolt CMS 自动创建的:id、slug、username、ownerid、status、templatefields。我已经删除了带有前缀的索引键,并添加了一个复合键。所以现在第一个查询运行了 100 毫秒,比以前快了。
  • 关于“不要在函数中隐藏列 (date(ba.datechanged))” datechanged 是日期时间字段,%Y-%m-%d 00:00:00。所以我不能只使用“2018-01-07”而不使用函数 date(datechanged)
  • DATEDATETIME 相比,文字"2018-01-07" 有效。 (请注意,我不关心我给出的示例;现在更新它。)
猜你喜欢
  • 2014-04-02
  • 2020-01-10
  • 2020-06-04
  • 2021-08-14
  • 1970-01-01
  • 2016-03-24
  • 2016-03-23
  • 1970-01-01
相关资源
最近更新 更多