如何在 MySQL 中有效地选择随机记录？答案

【问题标题】：How do I select a random record efficiently in MySQL?如何在 MySQL 中有效地选择随机记录？
【发布时间】：2011-02-12 01:22:45
【问题描述】：

mysql> EXPLAIN SELECT * FROM urls ORDER BY RAND() LIMIT 1;
+----+-------------+-------+------+---------------+------+---------+------+-------+---------------------------------+
| id | select_type | table | type | possible_keys | key  | key_len | ref  | rows  | Extra                           |
+----+-------------+-------+------+---------------+------+---------+------+-------+---------------------------------+
|  1 | SIMPLE      | urls  | ALL  | NULL          | NULL | NULL    | NULL | 62228 | Using temporary; Using filesort |
+----+-------------+-------+------+---------------+------+---------+------+-------+---------------------------------+

以上都不算高效，我应该怎么做呢？

更新

似乎使用答案中提到的解决方案仍然没有帮助：

mysql> explain SELECT  *
    -> FROM    (
    ->         SELECT  @cnt := COUNT(*) + 1,
    ->                 @lim := 10
    ->         FROM    urls
    ->         ) vars
    -> STRAIGHT_JOIN
    ->         (
    ->         SELECT  r.*,
    ->                 @lim := @lim - 1
    ->         FROM    urls r
    ->         WHERE   (@cnt := @cnt - 1)
    ->                 AND RAND(20090301) < @lim / @cnt
    ->         ) i;
+----+-------------+------------+--------+---------------+------+---------+------+-------+------------------------------+
| id | select_type | table      | type   | possible_keys | key  | key_len | ref  | rows  | Extra                        |
+----+-------------+------------+--------+---------------+------+---------+------+-------+------------------------------+
|  1 | PRIMARY     | <derived2> | system | NULL          | NULL | NULL    | NULL |     1 |                              |
|  1 | PRIMARY     | <derived3> | ALL    | NULL          | NULL | NULL    | NULL |    10 |                              |
|  3 | DERIVED     | r          | ALL    | NULL          | NULL | NULL    | NULL | 62228 | Using where                  |
|  2 | DERIVED     | NULL       | NULL   | NULL          | NULL | NULL    | NULL |  NULL | Select tables optimized away |
+----+-------------+------------+--------+---------------+------+---------+------+-------+------------------------------+

【问题讨论】：

标签： mysql sql-optimization

【解决方案1】：

Quassnoi 写了一个post，关于在不执行排序的情况下随机选择行。他的示例随机选择了 10 行，但您可以将其调整为仅选择一行。

如果您希望它真的快，那么您可以使用不完全一致或有时无法返回一行的近似值。

您也可以使用存储过程从Bill Karwin's post中快速选择随机行：

SET @r := (SELECT ROUND(RAND() * (SELECT COUNT(*) FROM mytable)));
SET @sql := CONCAT('SELECT * FROM mytable LIMIT ', @r, ', 1');
PREPARE stmt1 FROM @sql;
EXECUTE stmt1;

请注意，这将在 MyISAM 中比 InnoDB 运行得更快，因为 COUNT(*) 在 InnoDB 中很昂贵，但在 MyISAM 中几乎是即时的。

【讨论】：

@user198729：看你上面的代码你忘了把lim从10改成1。也许我说得不够清楚。
没关系，把10改成1后还是一样。注意第三行的解释输出。
@user198729：你有多少行？你的存储引擎是什么（InnoDB 或 MyISAM）？查询的运行时间是多少秒？
它是MyISAM，有62229 行。
@user198729：查询的运行时间是多少秒？

【解决方案2】：

好吧，如果您可以将一些逻辑移动到应用程序层（我没有误解您的问题），那么您只需在应用程序中生成随机 ID，然后对由该键标识的一条记录执行简单的选择。您需要知道的只是记录数。哦，如果那个键被删除了，就拿下一个。

【讨论】：