【发布时间】:2015-03-22 12:05:28
【问题描述】:
我有两个不同的表,它们的架构如下:
表1:
COLUMN_NAME COLUMN_TYPE
campaign_id varchar(50)
subscriber_id varchar(50)
message varchar(21000)
log_time datetime
log_type varchar(50)
level varchar(50)
campaign_name varchar(500)
表2:
COLUMN_NAME COLUMN_TYPE
guid varchar(100)
sid varchar(100)
url varchar(2500)
ip varchar(20)
is_new varchar(20)
ref varchar(2500)
user_agent varchar(255)
stats_time datetime
country varchar(50)
region varchar(50)
city varchar(50)
city_lat_long varchar(50)
email varchar(100)
我需要一个表,它是这两个表(不是所有列)的合并表,并且应该根据时间(表 1 中的 log_time 和表 2 中的 stats_time)对行进行排序。这两个表之间没有关系。
Table1 我需要的列是
campaign_id
subscriber_id
message
log_time
log_type
campaign_name
我需要的 Table2 的列是:
url
stats_time
email
我可以得到更优化的解决方案吗?
查询:
SELECT url, ip, stats_time, email, campaign_id, subscriber_id, campaign_name, log_time, log_type, time from
(
( SELECT url,ip,stats_time,email,NULL AS campaign_id,NULL AS subscriber_id ,NULL AS campaign_name,NULL AS log_time,NULL AS log_type, NULL AS message, UNIX_TIMESTAMP(stats_time) AS time FROM Tabel2 AS Table2Alias WHERE URL !='' AND EMAIL != '') Order by stats_time desc Limit 100
UNION ALL
( SELECT NULL AS url,NULL AS ip,NULL AS stats_time,NULL AS email,campaign_id,subscriber_id,campaign_name,log_time,log_type,message,UNIX_TIMESTAMP(log_time) AS time FROM Table1 AS Table1Alias WHERE (log_type='x1' OR log_type='x2' OR log_type='x3' OR log_type='x4') order by log_time desc Limit 100)
)
as ResultTable order by time desc
【问题讨论】:
-
先联合起来再按时间排序一次不是更快吗?
-
没有。桌子太大了。并且有一个向下滚动功能可以触发带有偏移量和限制的查询。因此,每当有滚动时,每次合并两个表并不快。
-
这样做的目的是什么?你想提取什么信息?
-
我需要这两个表中最近的 20 行。他们没有任何共同点。但是有一个时间列,我可以通过它获取最近的 20 行。
-
如果你只想要表组合中最近的 20 行,那么为什么要让它们返回 100 行,每行都带有
LIMIT?如果总共只需要 20 个,则每个只需要 20 个,然后您可以从这 40 个结果中选择最近的 20 个。