目录
番外篇
- 数据库的扩展没有web服务器那样容易
- sql查询速度,服务器硬件,网卡流量,磁盘IO,大表,大事务会对数据库性能造成影响,idle空闲时间
- max_connection默认是100,连接数超过100的话后面的请求会等待connection,如果超时就返回5XX错误
- SSK fashionIO磁盘
- 大表对DDL操作的影响
- MySQL 5.5前,建立索引会锁表
- MySQL 5.5后,不会缩表但会引起主从延迟
- 修改表结构需要长时间缩表
- 采用分库分表来拆分成多个小表
- 分表主键的选择
- 分表后跨分区数据的查询和统计
- 对大表的历史数据归档-可以减少对前后端业务的影响
- 归档时间点的选择
- 如何进行归档操作
- 大事务:运行时间长,操作的数据比较多的事务,例如余额宝计算用户昨天的收益,特别是理财产品买的多的情况下,回滚所需的时间长
MySQL体系结构
- MySQL最大的特点-插件式存储引擎(存储引擎可选),能够将数据的插入,提取相分离
MySQL基准测试
- 基准测试是对机器性能的测试,不同于普通的压力测试,不需要关心业务逻辑,类似redis-benchmark
- 建立MySQL服务器的性能基准线
- 模拟当前系统的更高负载,找出系统的瓶颈,找出QPS/TPS
- 基准测试方式
- 从系统入口测试,例如网站入口/APP;能反映系统各个组件间性能问题,测试比较复杂
- 单独对MySQL进行基准测试;设计简单,耗时短
- 结果统计
- QPS:单位时间内所处理的查询数
- TPS:单位时间内所处理的事务数
- 响应时间:平均响应时间、最小响应时间、最大响应时间、各时间所占百分比(P95/P90)
- 基准测试常用工具
- sysbench:跨平台,支持多线程,多种数据库,较为通用
- mysqlslap: mysql自带的
数据库结构优化
-
目的
- 尽量减少数据冗余
- 尽量避免数据维护中出现更新、插入和删除异常
- 节约数据存储空间
- 提高查询效率
-
需求分析
- 存储需求
- 数据处理需求
- 数据安全性和完整性
-
数据库设计范式
- 设计出没有数据冗余和数据维护异常的数据库结构
- 第一范式:字段不可分
- 第二范式:行数据有主键,非主键字段依赖主键
- 第三范式:行数据中非主键字段不能相互依赖,没有传递依赖(例如id, name, zip, province, city),其中province,city -> zip, zip -> id
-
字段数据类型选取
- 原则:当一个列可以选择多种数据类型时,应该优先考虑数字类型,其次是日期或二进制类型,最后是字符类型。对于相同级别的数据类型,应该优先选择占用空间小的数据类型。Innodb一列的最大大小是16K,当列越小,加载需要的宽度越少,加载越快。
- 整数类型
列类型 存储空间 Signed无符号 Unsigned有符号 tinyint 1字节 -128 ~ 127 0 ~ 255 smallint 2字节 -2^15 ~ 2^15 - 1 0 ~ 2^16 mediumint 3字节 -2^23 ~ 2^23 - 1 0 ~ 2^24 int 4字节 -2^31 ~ 2^31 - 1 0 ~ 2^32 bigint 8字节 -2^63 ~ 2^63 - 1 0 ~ 2^64
字节 1 bytes = 8 bit,1 个字节最多可以代表的数据长度是 2 的 8 次方 11111111,在计算机中也就是 - 128 到 127
- float:会丢失精度,在进行一些汇总的时候数据往往不正确
- double:比float精度高,也是非精确类型
- decimal:进度更高,是精确类型,存储空间要大一些
- DECIMAL从MySQL 5.1引入,列的声明语法是DECIMAL(M,D)。在MySQL 5.1中,参量的取值范围如下:
- M是数字的最大数(精度)。其范围为1~65(在较旧的MySQL版本中,允许的范围是1~254),M 的默认值是10。
- D是小数点右侧数字的数目(标度)。其范围是0~30,但不得超过M。
- 说明:float占4个字节,double占8个字节,decimail(M,D)占M+2个字节。
- 如DECIMAL(5,2) 的最大值为9 9 9 9 . 9 9,因为有7 个字节可用。
- varchar:存储变长字符串,以字符为单位;列的最小宽度小于255则占用一个额外字节,大于255则暂用两个额外的字节;varchar的最大宽度65535,由innodb数据引擎决定。使用时结合业务使用最小的符合需求的长度。如果后面改列宽度,要是依旧小于255,不锁表,否则锁表。查询时,内存会根据类型固定查询列的长度,如果列设置过大或不合理,就造成了内存浪费。
- char:存储定长的字符串,最大宽度255。char中如果存储的字符串末尾有空格,则会被自动删除掉,而varchar不会的哦。md5值适合使用char,身份证号啊。char适合存储经常被更新的值,因为Mysql会很方便的准备好列的宽度,而varchar不行。
- 日期类型
- datatime:占用8个存储空间,存储范围大。默认 YYYY-MM-DD HH:MM:SS,默认保持秒,也可以保留微秒,datatime同时区无关。
- timestamp:存储的时间戳,从格林尼治时间1970年1月1日到当前时间的秒数,占4个字节,只能保存1970-01-01到2038-01-19。显示的值依赖于所指定的时区。在表中指定任何一个timestamp列的值,当行数据修改时自动修改timestamp列的值,可以来标识最后修改时间,默认第一个timestamp列的值会自动更新,当然也可以指定哪一列自动更新。
- date: 存储用户生日的时候,占3个字节
- time:存储时间部分
MySQL的复制功能
- MySQL的复制是基于二进制日志增量进行的,会导致备库与主库存在数据不一致的问题
- 复制解决了什么问题
- 实现在不同服务器上的数据分布
- 实现数据读取的负载均衡
- 需要其他组件配合完成,利用DNS轮询的方式把程序的读连接到不同的备份数据库,利用LVS,haproxy这样的代理方式
- 复制
- 基于SQL语句的复制
- 二进制日志格式使用的是statement
- 基于行的复制
- 二进制日志格式使用的是基于行的日志格式
- 基于SQL语句的复制
MySQL日志
- MySQL服务层日志
- 二进制日志/慢查询日志/通用日志
- 二进制日志:记录了所有对mysql数据库的修改事件,包括增删改查事件和对表结构的修改事件。有个binlog的工具
- 二进制日志格式
- 基于段的格式 binlog_format=STATEMENT,日志量相对较小,节约磁盘和网络i/o
- 基于行的格式 默认格式,binlog_format=ROW。假设一SQL语句修改了1W天数据的情况下,基于段的日志只会记录这个SQL语句,基于行的日志会有1W条记录分别记录每一行的数据修改,可以避免主从复制不一致的的情况。binlog_row_image不同配置参数会导致日志量过大 ,建议设置成minimal,由mysql决定使用段还是行
- 二进制日志/慢查询日志/通用日志
- MySQL存储引擎层日志
- innodb中的重做日志/回滚日志
索引
- 定义: MySQL官方对索引的定义:索引(Index)是帮助MySQL高效获取数据的数据结构
- 作用:告诉存储引擎怎么快速的找到数据,索引是在存储引擎层实现的 - 以空间换时间(既要考虑空间,也要考虑时间)
- MySQL索引类型
- B-tree:以B+树的结构存储数据
- 可以使用到B树索引的:
- 全值匹配的查询: order_sn = ‘92322’
- 匹配最左前缀的查询: (order_sn, order_date)联合索引,中第一列可以用到索引
- 匹配列前缀查询:可以匹配列的前缀, order_sn like ‘92%’
- 范围查找:order_sn > ? and order_sn < ?
- not in和<>操作无法使用索引
- 如果查询中有某个列的范围查询,则其右边所有列都无法使用索引
- 可以使用到B树索引的:
- Hash索引:Hash索引是基于Hash表实现的,只有查询的条件精确匹配Hash索引中的所有列时,才能使用到Hash索引,也就是等值查询。存储引擎会为每一行计算一个Hash码,Hash索引中存储的就是Hash码,索引中没有保存行列的值,因此需要两次读取,第一次找到hash码,第二次根据hash码中的位置找到数据。Hash索引无法用于排序,同时可能存在Hash冲突
- B-tree:以B+树的结构存储数据
- 使用索引优缺点
- 优点
- 索引大大减少了存储引擎需要扫描的数据量
- 索引可以帮助我们进行排序以避免使用临时表
- 索引可以把随机IO变为顺序IO
- 缺点
- 索引会增加写操作的成本
- 太多的索引会增加查询优化器的选择时间
- 优点
- 索引优化策略
- 索引列上不能使用表达式或者函数,即使使用了存储引擎也不会使用这个索引,这时索引就没有意义了
- 选择索引列的顺序
- 经常会被使用的列优先
- 选择性高的列优先
- 宽度小的列优先
- 覆盖索引
- 可以优化缓存,减少磁盘IO操作
- 可以减少随机IO,变随机IO操作为顺序IO操作
- 可以避免对Innodb主键索引的二次查询
- 不能使用双%号的like查询
- mysql允许在同一列创建多个索引
- 建立了主键索引,就没必要再建立唯一索引了,因为主键索引就是一个非空的唯一索引
- 检测和删除重复/冗余的索引 pt-duplicate-key-checker h=127.0.0.1
- 查找未被使用过的索引,可以通过如下SQL查找,如果read和fetch都为0的话,那就是未被使用过的
select object_type,object_schema,object_name,index_name,count_star,count_read,COUNT_FETCH from performance_schema.table_io_waits_summary_by_index_usage;
- 更新索引统计信息及减少索引碎片
- analyze table table_name / optimize table table_name
- 索引规则
- mysql多列索引[组合索引]的生效规则
组合索引的生效原则是 从前向后依次生效,如果中间某个索引没有使用, 那么断点前面的索引部分起作用,断点后面的索引没有起作用,即最左优先原则
例如创建多列索引(a,b,c) where a=3 and b=45 and c=5... 这种三个索引顺序使用中间没有断点,全部发挥作用; where a=3 and c=5... 这种情况下b就是断点,a发挥了效果,c没有效果; where b=3 and c=4... 这种情况下a就是断点,在a后面的索引都没有发挥作用,这种写法联合索引没有发挥任何效果; where b=45 and a=3 and c=5... 这个跟第一个一样,全部发挥作用,abc只要用上了就行,跟写的顺序无关;
- 等值查询,范围查找
SQL查询优化
- 如何获取
- 终端用户反馈存在性能的SQL
- 通过慢查询日志获取存在性能问题的SQL
- 慢查询日志性能开销低,主要在IO和磁盘上
- show_query_log 启动停止记录慢查询日志,设置为on,这是个动态的参数
- show_query_log_file 指定慢查询日志的存储路径及文件,默认和日志存储在一起,建议分开
- long_query_time 单位是秒,可以设置为微秒,带小数,超过设置阀值的SQL就会被记录到慢查询中,默认为10秒
- log_queries_not_using_indexes 是否记录未使用索引的SQL
- 实时获取存在性能问题的SQL
- information_schema.PROCESSLIST表
- select * from processlist where time>=?;
- information_schema.PROCESSLIST表
- 常用的慢查询日志分析工具(mysqldumpslow)
- mysqldumpslow -s r -t 10s slow-mysql.log 猜测这个工具是从日志中过滤数据,类似linux命令
- pt-query-digest工具
- 查询慢的原因
- 步骤
-
- 客户端发送SQL请求给服务器
-
- 服务器检查是否可以在查询缓存中命中该SQL
- query_cache_type 设置查询缓存是否可用
- query_cache_size 设置查询缓存的内存大小
- query_cache_limit 设置查询缓存可用存储的最大值,缓存太大就不会存储了,如果预先知道查询结果大,就加上SQL_NO_CACHE来提高效率
- query_cache_wlock_invalidate 如果某个表被锁住了,是否返回缓存中的数据,默认是关闭的
- query_cache_min_res_unit 设置查询缓存分配的内存块的最小单位
-
读写比较频繁的话建议关闭缓存同时设置cache size为0
-
- 服务器进行SQL解析,预处理,再由优化器生成对应的执行计划
- SQL解析
- 对SQL语句进行解析,并生成一颗对应的“解析树”,也会对SQL语句进行校验,看参数是否正确等
- 优化
- 重新定义表的关联顺序
- 将外连接转换为内连接
- 使用等价变换规则(a=5 && a>5 -> a>=5)
- 优化count(), min()和max()
- 提前终止查询,如果碰到某个不符合条件
-
- 跟踪执行计划,调用存储引擎API来查询数据,有时需要在内存中过滤数据
-
- 将结果返回给客户端
-
- 步骤
- 确定查询处理各阶段所消耗的时间
-
使用profile
- set profilling=1,启动profiling,这是一个session级别的设置,使用show profiles查看每一个查询所消耗的时间,show profile for query N, n是上一个query的id。也可以使用show profile cpu for query N来查看cpu的情况
[外链图片转存失败,源站可能有防盗链机制,建议将图片保存下来直接上传(img-ZB778ynL-1613619878022)(img/mysql_profile_demo.png)]
-
performance_schema是mysql5.6之后的查询性能分析工具,推荐使用
-
- 如何优化not in和<>查询
- not in的话可以使用left join或者right join来替代,不然它会扫描多次not in的表
- 使用汇总表优化查询
- select count(*) from X;创建一个汇总表,不是太好,不能实时
数据库监控
- 监控哪些
- 对数据库服务可用性监控,数据库的进程或者端口能ping通并不代表数据库可用,建议创建连接,简单的获取或者创建数据进行测试
常用命令
show variables like '%isolation' --查看数据库事务隔离级别的设置
show variables like 'binlog_format' --查看二进制日志格式
show create table tablename\G --显示表结构
select object_type,object_schema,object_name,index_name,count_star,count_read,COUNT_FETCH from performance_schema.table_io_waits_summary_by_index_usage --查找未被使用的索引
常用函数
replace: 替换特定的字符串
语法:replace(object,search,replace)
语义:把object对象中出现的的search全部替换成replace。
实例:
update hellotable set 'helloCol' = replace('helloCol','helloSearch','helloReplace')
比如将日期中的:号替换成空: REPLACE(datetime, ':', '')
replace into
replace into函数
为什么会接触到replace into函数,是因为业务需要向数据库中插入数据,前提是重复的不能再次插入。以前用where解决的,今天才知道还有一个更简洁的方法replace。
replace具备替换拥有唯一索引或者主键索引重复数据的能力,也就是如果使用replace into插入的数据的唯一索引或者主键索引与之前的数据有重复的情况,将会删除原先的数据,然后再进行添加。
语法:replace into table( col1, col2, col3 ) values ( val1, val2, val3 )
语义:向table表中col1, col2, col3列replace数据val1,val2,val3
实例:
REPLACE INTO users (id,name,age) VALUES(123, ‘chao’, 50);
截取字符串
-- 从左开始截取字符串: left(str, legth)
SELECT LEFT('www.baidu.com', 8); --www.baid
-- 从右开始截取字符串: right(str, length)
SELECT RIGHT('www.baidu.com', 8); --aidu.com
-- 截取特定长度的字符串
----- substring(str, pos) 从pos位置开始算起,从1开始
SELECT SUBSTRING('www.baidu.com', 3); --w.baidu.com
SELECT SUBSTRING('www.baidu.com', -3); --com 从倒数第三个位置开始
----- substring(str, pos, length) 从pos位置开始,截取length长度
SELECT SUBSTRING('www.baidu.com', 3, 3); -- w.b
SELECT SUBSTRING('www.baidu.com', -4, 2); --.c
-- 按关键字截取 substring_index(str, delim, count) str被截取的字符串,提取的关键字,关键字出现的次数
SELECT SUBSTRING_INDEX('www.baidu.com', '.', 2); --截取第二个.之前的所有字符 www.baidu
SELECT SUBSTRING_INDEX('www.baidu.com', '.', -2); --截取倒数第二个.之后的所有字符串 baidu.com
SELECT SUBSTRING_INDEX('www.baidu.com', 'xxx', 1); --截取关键字不存在返回原字符串 1还是代表首次出现的位置,也可以换乘其他值
注意点
- 最好不要在主库上做数据库备份,大型活动前取消这类计划
- 如何为innodb选择主键
- 主键应该尽可能的小,主键应该是顺序增长的(提升数据的插入效率)
- 大表的数据修改最好要分批处理
- 在线修改表结构
- 新建一个表,在老表上建立触发器,将老表的数据同步到新表,等到老表和新表数据一致时,在老表上建立一个排他锁,将新表命名为老表的名字。有工具实现 pt-online-schema-change
CentOS中安装MySQL
- 查看官方文档 https://dev.mysql.com/doc/mysql-yum-repo-quick-guide/en/
- 下载MySQL yum包 http://dev.mysql.com/downloads/repo/yum/(要查看系统的版本 uname -a)
- 下载yum包 wget http://repo.mysql.com/mysql57-community-release-el7-10.noarch.rpm
- 安装软件源 rpm -Uvh platform-and-version-specific-package-name.rpm
- 安装mysql服务端 yum install -y mysql-community-server
- 启动myssql service mysqld start
注意
- 首次启动后要及时登陆并修改密码
- 使用
grep 'temporary password' /var/log/mysqld.log
获取临时密码 mysql -uroot -p
输入密码登陆- 修改全局参数
set global validate_password_policy=0;
set global validate_password_length=1;
- 修改密码 `ALTER USER ‘root’@‘localhost’ IDENTIFIED BY ‘xxxxxx’;
- 开启远程连接
Grant all privileges on *.* to 'root'@'%' identified by 'yourpassword' with grant option;
flush privileges;
查看MySql数据库物理文件存放位置
- mysql> show global variables like “%datadir%”
- Windows中一般存储在C:\ProgramData\MySQL Server 5.6\Data\
- Linux中在/var/lib/mysql/
- 同理,可以显示全部的全局变量
- show global variables;
Mysql执行sql文件
- 进入mysql安装目录,找到mysql.exe所在文件夹
mysql -uroot -p123456 -Ddbname<C:\a.sql
- 进入mysql command
source C:\a.sql
关键字解读
-
COLLATE(英文是校对的意思)
COLLATE通常是和数据编码(CHARSET)相关的,一般来说每种CHARSET都有多种它所支持的COLLATE,并且每种CHARSET都指定一种COLLATE为默认值。例如Latin1编码的默认COLLATE为latin1_swedish_ci,GBK编码的默认COLLATE为gbk_chinese_ci,utf8mb4编码的默认值为utf8mb4_general_ci。所谓utf8_unicode_ci,其实是用来排序的规则。对于mysql中那些字符类型的列,如VARCHAR,CHAR,TEXT类型的列,都需要有一个COLLATE类型来告知mysql如何对该列进行排序和比较。简而言之,COLLATE会影响到ORDER BY语句的顺序,会影响到WHERE条件中大于小于号筛选出来的结果,会影响DISTINCT、GROUP BY、HAVING语句的查询结果。另外,mysql建索引的时候,如果索引列是字符类型,也会影响索引创建,只不过这种影响我们感知不到。总之,凡是涉及到字符类型比较或排序的地方,都会和COLLATE有关。
很多COLLATE都带有_ci字样,这是Case Insensitive的缩写,即大小写无关,也就是说"A"和"a"在排序和比较的时候是一视同仁的。selection * from table1 where field1="a"同样可以把field1为"A"的值选出来。与此同时,对于那些_cs后缀的COLLATE,则是Case Sensitive,即大小写敏感的。
设置COLLATE可以在示例级别、库级别、表级别、列级别、以及SQL指定。 -
utf8mb4
mysql中有utf8和utf8mb4两种编码,在mysql中请大家忘记utf8,永远使用utf8mb4。这是mysql的一个遗留问题,mysql中的utf8最多只能支持3bytes长度的字符编码,对于一些需要占据4bytes的文字,mysql的utf8就不支持了,要使用utf8mb4才行。 -
mysql中int(3)与int(11)有什么区别吗?
注意:这里的M代表的并不是存储在数据库中的具体的长度,以前总是会误以为int(3)只能存储3个长度的数字,int(11)就会存储11个长度的数字,这是大错特错的。
其实当我们在选择使用int的类型的时候,不论是int(3)还是int(11),它在数据库里面存储的都是4个字节的长度,在使用int(3)的时候如果你输入的是10,会默认给你存储位010,也就是说这个3代表的是默认的一个长度,当你不足3位时,会帮你不全,当你超过3位时,就没有任何的影响。
前天组管问我 int(10)与int(11)有什么区别,当时觉得就是长度的区别吧,现在看,他们之间除了在存储的时候稍微有点区别外,在我们使用的时候是没有任何区别的。int(10)也可以代表2147483647这个值int(11)也可以代表。
要查看出不同效果记得在创建类型的时候加 zerofill这个值,表示用0填充,否则看不出效果的。
我们通常在创建数据库的时候都不会加入这个选项,所以可以说他们之间是没有区别的。
另外如果想用正整数就使用UNSIGNED
关键字加在column上 -
varchar(n)
首先要确定mysql版本
4.0版本以下,varchar(50),指的是50字节,如果存放UTF8汉字时,只能存16个(每个汉字3字节)
5.0版本以上,varchar(50),指的是50字符,无论存放的是数字、字母还是UTF8汉字(每个汉字3字节),都可以存放50个
进阶
性能查询
MySQL性能优化的核心要素:合理利用索引,降低锁影响,提高事务并发度
show variables like ‘optimizer_trace’;
set session optimizer_trace=“enabled=on”, end_markers_in_json=on;
set optimizer_trace_max_mem_size=100000;
show status like ‘Threads%’;
数据页的空间利用率
为什么简单地删除表数据达不到表空间回收的效果,然后再和你介绍正确回收空间的方法。
delete 命令其实只是把记录的位置,或者数据页标记为了“可复用”,但磁盘文件的大小是不会变的。也就是说,通过 delete 命令是不能回收表空间的。这些可以复用,而没有被使用的空间,看起来就像是“空洞”。
实际上,不止是删除数据会造成空洞,插入数据也会。
也就是说,经过大量增删改的表,都是可能是存在空洞的。所以,如果能够把这些空洞去掉,就能达到收缩表空间的目的。
而重建表,就可以达到这样的目的。
alter table A engine=InnoDB 命令来重建表
百问
- MYSQL 索引长度的限制
myisam表,单列索引,最大长度不能超过 1000 bytes;
innodb表,单列索引,最大长度不能超过 767 bytes;
utf8 编码时 一个字符占三个字节
varchar 型能建立索引的最大长度分别为
myisam 1000/3 333
innodb 767/3 255
utf8mb4 编码时 一个字符占四个字节
varchar 型能建立索引的最大长度分别为
myisam 1000/4 250
innodb 767/4 191
实战
MySQL的优化点可以说是在表的设计和使用上,以下的实战总结也从这两方面来总结
设计
- 前缀索引(不支持范围查找)。使用前缀索引,定义好长度,就可以做到既节省空间,又不用额外增加太多的查询成本。
- 查eamil。可以使用前缀索引,那么怎么定义好这个长度呢?
select
count(distinct left(email,4))as L4,
count(distinct left(email,5))as L5,
count(distinct left(email,6))as L6,
count(distinct left(email,7))as L7,
from SUser;
当然,使用前缀索引很可能会损失区分度,所以你需要预先设定一个可以接受的损失比例,比如 5%。然后,在返回的 L4~L7 中,找出不小于 L * 95% 的值,假设这里 L6、L7 都满足,你就可以选择前缀长度为 6。 使用前缀索引不能避免要回表一次来获取完整数据
,因为系统并不确定索引是不是被截断了的。
- 身份证。公民的身份证是18位,前6位是地址,精确到县,接着6位是年月,如果使用前缀索引,至少得去前12位,才能满足区分度,但是索引选的越长,占用的磁盘空间越大,相同的数据页能放下的索引值就越少,搜索的效率越低。可以使用倒序存储身份证,取身份证的后6位做前缀索引;或者新增一个字段,对身份证及进行hash(不支持范围查找)
使用
INSERT
DELETE
- 根据业务来决定是物理删除还是软删除
UPDATE
SELECT
通用原则:在保证逻辑正确的前提下,尽量减少扫描的数据量,是数据库系统设计的通用原则之一。
- 避免全表扫描。随着数据量的递增,全表扫描带来的性能消耗越来越大。可以通过其他业务模块来辅助标记,比如我曾在Timing业务中写一个晚上9点给sp发群总结的job,当时就是要过滤出来所有sp创建的并且未解散的群,查询条件无法命中现有索引,只能全表扫描,随着业务的发展,数据量越来越大,单次查询的时间已经到了10几秒,系统层面已经无法接受,只能曲线救国。于是在sp创建群和解散群的时候,往redis中存放群的id,这样就把全表扫描变成了range获取了,命中primary key
- 只查出来需要的字段,不要使用*。
count
你首先要明确的是,在不同的 MySQL 引擎中,count(*) 有不同的实现方式。
- MyISAM 引擎把一个表的总行数存在了磁盘上,因此执行 count(*) 的时候会直接返回这个数,效率很高;
- 而 InnoDB 引擎就麻烦了,它执行 count() 的时候,需要把数据一行一行地从引擎里面读出来,然后累积计数。当然InnoDB也没那么笨,我们知道InnoDB是索引组织表,主键索引的叶子节点是数据,而普通索引的叶子节点是主键,因此对于count()这样的操作,查哪个索引结果都是一样的,MySQL会找到最小的那棵树来遍历。
这里需要注意的是,我们在这篇文章里讨论的是没有过滤条件的 count(*),如果加了 where 条件的话,MyISAM 表也是不能返回得这么快的。