【发布时间】:2011-07-20 22:59:26
【问题描述】:
我有以下表格:
CREATE TABLE `data` (
`date_time` decimal(26,6) NOT NULL,
`channel_id` mediumint(8) unsigned NOT NULL,
`value` varchar(40) DEFAULT NULL,
`status` tinyint(3) unsigned DEFAULT NULL,
`connected` tinyint(1) unsigned NOT NULL,
PRIMARY KEY (`channel_id`,`date_time`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;
CREATE TABLE `channels` (
`channel_id` mediumint(8) unsigned NOT NULL AUTO_INCREMENT,
`channel_name` varchar(40) NOT NULL,
PRIMARY KEY (`channel_id`),
UNIQUE KEY `channel_name` (`channel_name`)
) ENGINE=MyISAM DEFAULT CHARSET=latin1;
我想知道是否有人可以就如何优化或重写以下查询给我一些建议:
SELECT channel_name, t0.date_time, t0.value, t0.status, t0.connected, t1.date_time, t1.value, t1.status, t1.connected FROM channels,
(SELECT MAX(date_time) AS date_time, channel_id, value, status, connected FROM data
WHERE date_time <= 1300818330
GROUP BY channel_id) AS t0
RIGHT JOIN
(SELECT MAX(date_time) AS date_time, channel_id, value, status, connected FROM data
WHERE date_time <= 1300818334
GROUP BY channel_id) AS t1
ON t0.channel_id = t1.channel_id
WHERE channels.channel_id = t1.channel_id
基本上,我在两个不同时间获取每个 channel_name 的值、状态和连接字段。由于 t0 始终
问题好像是因为我加入了子查询,所以没有索引可以用?我尝试重写它以首先对数据表的 channel_id 进行自连接,但那是数百万行。
如果能够在 t0.value = t1.value & t0.status = t1.status & t0.connected = t1.connected 时为每个最终行添加一个布尔字段,这将是一件好事。
非常感谢您的宝贵时间。
【问题讨论】:
-
为什么要使用特定的日期时间过滤器?您还会获得不一定与 MAX(datetime) 相关的随机数据,因为 group by 不会按您期望的方式工作。
-
您可能拥有多少个渠道与多少数据记录?
-
我输入的具体date_times是随机的,会是php代码中的变量。通道的数量将远小于数据记录的数量。可能有大约 100,000 个或更多通道,但可能有数百万条数据记录。 group by 是否不返回对应于该最大 date_time 的行?
标签: mysql optimization join groupwise-maximum