Mysql 性能和计数(*)答案

【问题标题】：Mysql performance and Count(*)Mysql 性能和计数(*)
【发布时间】：2009-10-06 14:02:56
【问题描述】：

我想知道我的 sql 在线性时间或 log(n) 时间内执行计数查询，我认为如果查询参数被索引，它可以通过 cubing 来完成

【问题讨论】：

标签： sql mysql database performance count

【解决方案1】：

MyISAM 将立即返回。
InnoDB 会进行 PK 扫描，因此时间会随着记录数的增加而线性增加。

如果您需要查看 InnoDB 表大约保存了多少条记录，最快的方法是使用

EXPLAIN select * from student;

（但innodb的统计数据可能有误，所以40%的错误也很有可能）

【讨论】：

这适用于普通的“SELECT COUNT(*) FROM myTable”查询。然而，时间复杂度各不相同，查询包含任何过滤器或其他约束。
40% 错误？怎么可能错得这么远？这是一个真正的问题，我不是 MySQL 用户所以我不知道。
对于 InnoDB 来说，预测要扫描的行数有 40% 的错误是非常可能的。但是97%的执行计划是准确的。（好吧，当需要索引提示时，可能会伤害其他 3%）

【解决方案2】：

这完全取决于查询，或者更准确地说，取决于 MySql 最终选择来处理查询的查询计划。

在这些大 O 表达式中，这完全取决于我们所说的“n”是什么意思。例如，如果“n”是最终返回的计数值，并且如果该计数是由需要迭代扫描多个表的查询产生的，则复杂性可能比线性更差。

【讨论】：

【解决方案3】：

这个问题的答案很复杂。它不仅取决于所涉及的表的数量，还取决于您使用的存储引擎。

话虽如此，手册上是这样说的：

COUNT(*) 被优化为返回非常如果 SELECT 从一张表，没有其他列检索到，并且没有 WHERE 条款。例如：

mysql> SELECT COUNT(*) FROM student;

此优化仅适用于仅限 MyISAM 表，因为精确存储此存储的行数引擎，可以非常访问迅速地。用于事务存储 InnoDB 等引擎，存储一个确切的行数更成问题因为可能有多个交易发生，每一个都可能影响计数。

-- MySQL Manual

【讨论】：

我的查询包含 where 子句，但 where 子句中的属性已编入索引。我可以使用例如立方体或相同的技术吗？