【问题标题】:how to partition a table by datetime column?如何按日期时间列对表进行分区?
【发布时间】:2011-05-23 06:27:27
【问题描述】:

我想按日期时间列对 mysql 表进行分区。一天一个分区。建表脚本是这样的:

CREATE TABLE raw_log_2011_4 (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  logid char(16) NOT NULL,
  tid char(16) NOT NULL,
  reporterip char(46) DEFAULT NULL,
  ftime datetime DEFAULT NULL,
  KEY id (id)
) ENGINE=InnoDB AUTO_INCREMENT=286802795 DEFAULT CHARSET=utf8
PARTITION BY hash (day(ftime)) partitions 31;

但是当我选择某天的数据时,找不到分区。select语句是这样的:

explain partitions select * from raw_log_2011_4 where day(ftime) = 30;

当我使用另一个语句时,它可以找到分区,但我无法选择某一天的数据。

explain partitions select * from raw_log_2011_4 where ftime = '2011-03-30';

有没有人告诉我如何选择某一天的数据并利用分区。谢谢!

【问题讨论】:

标签: mysql datetime hash database-partitioning


【解决方案1】:

HASH 分区对于日期时间列来说是一个非常糟糕的主意,因为它不能使用partition pruning。来自 MySQL 文档:

修剪只能用于分区表的整数列 哈希或密钥。例如,表 t4 上的这个查询不能使用剪枝 因为 dob 是 DATE 列:

SELECT * FROM t4 WHERE dob >= '2001-04-14' AND dob <= '2005-10-15';

但是,如果表将年份值存储在 INT 列中,则 具有 WHERE year_col >= 2001 AND year_col

因此您可以将 TO_DAYS(DATE()) 的值存储在额外的 INTEGER 列中以使用修剪。

另一种选择是使用 RANGE 分区:

CREATE TABLE raw_log_2011_4 (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  logid char(16) NOT NULL,
  tid char(16) NOT NULL,
  reporterip char(46) DEFAULT NULL,
  ftime datetime DEFAULT NULL,
  KEY id (id)
) ENGINE=InnoDB AUTO_INCREMENT=286802795 DEFAULT CHARSET=utf8
  PARTITION BY RANGE( TO_DAYS(ftime) ) (
    PARTITION p20110401 VALUES LESS THAN (TO_DAYS('2011-04-02')),
    PARTITION p20110402 VALUES LESS THAN (TO_DAYS('2011-04-03')),
    PARTITION p20110403 VALUES LESS THAN (TO_DAYS('2011-04-04')),
    PARTITION p20110404 VALUES LESS THAN (TO_DAYS('2011-04-05')),
    ...
    PARTITION p20110426 VALUES LESS THAN (TO_DAYS('2011-04-27')),
    PARTITION p20110427 VALUES LESS THAN (TO_DAYS('2011-04-28')),
    PARTITION p20110428 VALUES LESS THAN (TO_DAYS('2011-04-29')),
    PARTITION p20110429 VALUES LESS THAN (TO_DAYS('2011-04-30')),
    PARTITION future VALUES LESS THAN MAXVALUE
  );

现在下面的查询将只使用分区 p20110403:

SELECT * FROM raw_log_2011_4 WHERE ftime = '2011-04-03';

【讨论】:

  • 我正在学习分区,为什么DATE_FORMAT() 不需要在WHERE 语句中使用?
  • @Steyx - 也许你的意思是WHERE ftime &gt;= '2011-04-03' AND ftime &lt; '2011-04-03' + INTERVAL 1 DAY
  • PARTITION BY RANGE( TO_DAYS(datetime) ) 应该是 PARTITION BY RANGE( TO_DAYS(ftime) ) 。请更正并更新它。谢谢你
  • 根据您链接的文档,在我看来,如果 TO_DAYS() 完成了修剪,对吧? “当分区表达式使用 YEAR() 或 TO_DAYS() 函数时,也可以对在 DATE 或 DATETIME 列上分区的表应用修剪。当分区表达式使用 TO_SECONDS() 函数时,也可以对此类表应用修剪”
【解决方案2】:

您好,您在表定义中进行了错误的分区,表定义如下:

CREATE TABLE raw_log_2011_4 (
  id bigint(20) NOT NULL AUTO_INCREMENT,
  logid char(16) NOT NULL,
  tid char(16) NOT NULL,
  reporterip char(46) DEFAULT NULL,
  ftime datetime DEFAULT NULL,
  KEY id (id)
) ENGINE=InnoDB AUTO_INCREMENT=286802795 DEFAULT CHARSET=utf8
PARTITION BY hash (TO_DAYS(ftime)) partitions 31;

你的选择命令是:

explain partitions 
    select * from raw_log_2011_4 where TO_DAYS(ftime) = '2011-03-30';

上面的命令会选择所有需要的日期,就像你使用 TO_DAYS 命令一样

mysql> SELECT TO_DAYS(950501);
        -> 728779
mysql> SELECT TO_DAYS('2007-10-07');
        -> 733321

为什么要使用 TO_DAYS AS MySQL 优化器将识别两个基于日期的函数来进行分区修剪: 1.TO_DAYS() 2.YEAR()

这会解决你的问题..

【讨论】:

  • ^1 如果表中的年数未知,PARTITION BY hash (YEAR(ftime)) 是否有效?
【解决方案3】:

我最近在http://dev.mysql.com/tech-resources/articles/mysql_55_partitioning.html 阅读了一篇与此相关的 MySQL 博客文章。

5.1 之前的版本需要特殊操作才能根据日期进行分区。上面的链接讨论了它并显示了示例。

5.5 及更高版本允许您使用非数字值(例如日期和字符串)进行直接分区。

【讨论】:

    【解决方案4】:

    不要使用CHAR,使用VARCHAR。这将节省大量空间,从而减少 I/O,从而加快查询速度。

    reporterip: (46) 对于 IP 地址来说太大了,即使是 IPv6。请参阅My blog 进行进一步讨论,包括如何将其缩小到 16 字节。

    PARTITION BY RANGE(TO_DAYS(...)) 正如@Steyx 建议的那样,但分区不超过 50 个。尽管进行了“修剪”,但您拥有的分区越多,查询速度就越慢。 HASH 分区基本没用。

    More discussion of partitioning, especially the type you are looking at。这包括随着时间推移的一组滑动分区的代码。

    【讨论】:

    • “不要使用 CHAR,使用 VARCHAR”作为一般规则似乎是一个糟糕的建议,尤其是在这种情况下。如果所有logid 值都有16 个字节,那么CHAR(16) 需要16 个字节,VARCHAR(16) 需要17 个字节。此外,据报道,CHAR 上的索引查找速度更快。这与实际问题(分区)无关。对于CHARVARCHAR,请参阅dba.stackexchange.com/questions/2640/…
    • @ChristopherK。 - 如果logid 总是16 字节,那么,当然,使用CHAR(16)。但也可能说CHARACTER SET ascii
    • 是的。对于多字节字符集,CHAR(16) 可以大于 16 个字节,但对于 VARCHAR(16) 也是如此。这一切都在我链接的问题中进行了讨论。我只是想明确一点,“不要使用 CHAR,使用 VARCHAR”通常不是一个好的建议。
    • CHAR(16) -- 如果 ascii 将占用 16 个字节;如果 utf8mb4 将占用 64 个字节,即使其中仅存储 ascii 字符。
    猜你喜欢
    • 2016-02-21
    • 2012-02-16
    • 1970-01-01
    • 2020-04-29
    • 1970-01-01
    • 2016-10-28
    • 2019-03-12
    • 2018-10-19
    • 2019-12-16
    相关资源
    最近更新 更多