【问题标题】:How do I select a random record efficiently in MySQL?如何在 MySQL 中有效地选择随机记录?
【发布时间】:2011-02-12 01:22:45
【问题描述】:
mysql> EXPLAIN SELECT * FROM urls ORDER BY RAND() LIMIT 1;
+----+-------------+-------+------+---------------+------+---------+------+-------+---------------------------------+
| id | select_type | table | type | possible_keys | key  | key_len | ref  | rows  | Extra                           |
+----+-------------+-------+------+---------------+------+---------+------+-------+---------------------------------+
|  1 | SIMPLE      | urls  | ALL  | NULL          | NULL | NULL    | NULL | 62228 | Using temporary; Using filesort |
+----+-------------+-------+------+---------------+------+---------+------+-------+---------------------------------+

以上都不算高效,我应该怎么做呢?

更新

似乎使用答案中提到的解决方案仍然没有帮助:

mysql> explain SELECT  *
    -> FROM    (
    ->         SELECT  @cnt := COUNT(*) + 1,
    ->                 @lim := 10
    ->         FROM    urls
    ->         ) vars
    -> STRAIGHT_JOIN
    ->         (
    ->         SELECT  r.*,
    ->                 @lim := @lim - 1
    ->         FROM    urls r
    ->         WHERE   (@cnt := @cnt - 1)
    ->                 AND RAND(20090301) < @lim / @cnt
    ->         ) i;
+----+-------------+------------+--------+---------------+------+---------+------+-------+------------------------------+
| id | select_type | table      | type   | possible_keys | key  | key_len | ref  | rows  | Extra                        |
+----+-------------+------------+--------+---------------+------+---------+------+-------+------------------------------+
|  1 | PRIMARY     | <derived2> | system | NULL          | NULL | NULL    | NULL |     1 |                              |
|  1 | PRIMARY     | <derived3> | ALL    | NULL          | NULL | NULL    | NULL |    10 |                              |
|  3 | DERIVED     | r          | ALL    | NULL          | NULL | NULL    | NULL | 62228 | Using where                  |
|  2 | DERIVED     | NULL       | NULL   | NULL          | NULL | NULL    | NULL |  NULL | Select tables optimized away |
+----+-------------+------------+--------+---------------+------+---------+------+-------+------------------------------+

【问题讨论】:

    标签: mysql sql-optimization


    【解决方案1】:

    Quassnoi 写了一个post,关于在不执行排序的情况下随机选择行。他的示例随机选择了 10 行,但您可以将其调整为仅选择一行。

    如果您希望它真的快,那么您可以使用不完全一致或有时无法返回一行的近似值。

    您也可以使用存储过程从Bill Karwin's post中快速选择随机行:

    SET @r := (SELECT ROUND(RAND() * (SELECT COUNT(*) FROM mytable)));
    SET @sql := CONCAT('SELECT * FROM mytable LIMIT ', @r, ', 1');
    PREPARE stmt1 FROM @sql;
    EXECUTE stmt1;
    

    请注意,这将在 MyISAM 中比 InnoDB 运行得更快,因为 COUNT(*) 在 InnoDB 中很昂贵,但在 MyISAM 中几乎是即时的。

    【讨论】:

    • @user198729:看你上面的代码你忘了把lim从10改成1。也许我说得不够清楚。
    • 没关系,把10改成1后还是一样。注意第三行的解释输出。
    • @user198729:你有多少行?你的存储引擎是什么(InnoDB 或 MyISAM)?查询的运行时间是多少秒?
    • 它是MyISAM,有62229 行。
    • @user198729:查询的运行时间是多少秒?
    【解决方案2】:

    好吧,如果您可以将一些逻辑移动到应用程序层(我没有误解您的问题),那么您只需在应用程序中生成随机 ID,然后对由该键标识的一条记录执行简单的选择。您需要知道的只是记录数。哦,如果那个键被删除了,就拿下一个。

    【讨论】:

      猜你喜欢
      • 1970-01-01
      • 1970-01-01
      • 1970-01-01
      • 2019-03-25
      • 2011-02-01
      • 1970-01-01
      • 1970-01-01
      • 2018-11-30
      • 2011-04-08
      相关资源
      最近更新 更多