【数据库相关】MySql之慢Sql优化|烟霞志

为什么要进行sql优化？

从数据库角度来看，每个sql在执行过程中都需要消耗掉一定的I/O资源，sql执行的快慢，决定了资源被占用的时间的长短，假设总资源是100，有一条慢sql占用了30的资源一分钟，那么在这一分钟里，其它sql能使用的资源就只剩70，如此循环下去，所有的资源都被占满了，其它所有的新sql都要排队等待。
在应用层面表现就是应用卡死了，没有数据返回，这是不合理的。
但进行sql优化最重要的原因是：这是提高系统性能性价比最高的方式，代价最小，效果却最明显。

如何排查慢sql

当Mysql性能下降时，我们可以通过开启慢查询来获得哪条sql造成的响应过慢，进行分析处理。注意：开启慢sql查询会带来Cpu的损耗和日志记录的I/O开销，所以我们要针对性的打开查询。
慢sql查询能够记录下所有执行时间超过long_query_time时间的sql语句，方便我们进行针对性的优化。
查看是否开启慢sql查询：show variables like '%slow_query%';

slow_query_log_file为慢sql日志存放位置。
查询默认慢查询sql时间：show variables like '%long_query_time%';
开启慢sql查询：set global slow_query_log = 'ON';
Mysql默认的慢sql十秒的时间太长了，我们根据实际情况进行修改:set long_query_time = 1;

测试一下：select sleep(2);

分析慢sql语句：explain关键字

此处参考了B站尚硅谷周阳老师的教学视频，链接：https://www.bilibili.com/video/BV1KW411u7vy
讲得很好，小伙伴们可以去看看。

mysql官方定义：

使用EXPLAIN关键字可以模拟优化器执行SQL查询语句，从而知道MySQL是如何处理你的SQL语句的。分析你的查询语句或是表结构的性能瓶颈。

通过使用explain。我们可以得到以下结果：

表的读取顺序
数据读取操作的操作类型
哪些索引可以使用
哪些索引被实际引用
表之间的引用
每张表有多少行被优化器查询

使用方式

explain select * from tbl_emp;

执行计划：

执行计划的各个字段的含义

Id

id的结果共有三种情况

id相同，执行顺序根据“table”由上往下。
id不同，如果是子查询，id的序号会递增，id的值越大，优先级越高，越先被执行。
id相同和不同的情况同时存在。id如果相同，可以认为是一组，从上往下顺序执行；在所有组中，id值越大，优先级越高，越先执行。

select_type

常见的值如下：

分别用来表示查询的类型，主要是用于区别普通查询、联合查询、子查询等的复杂查询

SIMPLE：简单的select查询，查询中不包含子查询或UNINO
PRIMARY：查询中若包含任何复杂的子部分，最外层大的查询则被标记为PRIMARY
SUBQUERY：在select或where中包含了子查询
DERIVED：在from列表中包含的子查询被标记为DERIVED，Mysql会递归执行这些子查询，把结果放在临时表中
UNION：若第二个SELECT出现在UNION之后，则被标记为UNION：若UNION包含在FROM子句的子查询中，外层SELECT将被标记为：DERIVED
UNINO RESULT：从UNION表获取结果的SELECT

table

显示这一行的数据是关于哪张表的。

type

显示当前查询使用了何种类型，从最好到最差依次是：
system > const > eq_ref > ref > range > index > all

一般来说，得保证查询至少达到range级别，最好能达到ref。

systeam：表中只有一行记录（等同于系统表），这是const类型的特例，平时不会出现，可以忽略不计
const：表示通过索引依次就找到了，const用于比较primary key 或 unique索引。因为只匹配一行数据，所以很快。如果将主键置于where条件中，Mysql就能将该查询转换为一个常量
eq_ref：唯一索引扫描，对于每个索引键，表中只有一条记录与之匹配。常见于主键或唯一索引扫描。
ref：非唯一性索引扫描（普通索引），返回匹配某个单独值所有的行，本质也是一种索引访问，它返回所有匹配某个单独值的行，然而，它可能会找到多个符号条件的行。
range：只检索给定范围的行，使用一个索引来选择行，key列显示使用了哪个索引，一般就是在你的where语句中出现between、<、>、in等
index：Full Index Scan，index与All区别为index类型只遍历索引树，通常比ALL快，因为索引文件通常比数据文件小。
all：Full Table Scan，遍历全表以找到匹配的行。

possible_keys

显示可能应用在这张表中的索引，一个或多个。查询涉及到的字段上若存在索引，则该索引将被列出，但不一定被查询实际使用。

key

实际使用的索引，如果为NULL，则没有使用索引。（可能原因包括没有建立索引或索引失效）
查询中若使用了覆盖索引（select 后要查询的字段刚好和创建的索引字段完全相同），则该索引仅出现在key列表中

key_len

表示索引中使用的字节数，可通过该列计算查询中使用的索引的长度，在不损失精确性的情况下，长度越短越好。key_len显示的值为索引字段的最大可能长度，并非实际使用长度，即key_len是根据表定义计算而得，不是通过表内检索出的。

ref

显示索引的那一列被使用了，如果可能的话，最好是一个常数。哪些列或常量被用于查找索引列上的值。

rows

根据表统计信息及索引选用情况，大致估算出找到所需的记录所需要读取的行数，也就是说，用的越少越好

Extra

包含不适合在其他列中显式但十分重要的额外信息

Using filesort：说明mysql会对数据使用一个外部的索引排序，而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成的排序操作称为“文件排序”。
Using temporary：使用了用临时表保存中间结果，MySQL在对查询结果排序时使用临时表。常见于排序order by和分组查询group by。
Using index：表示相应的select操作中使用了覆盖索引（Covering Index），避免访问了表的数据行，效率不错。如果同时出现using where，表明索引被用来执行索引键值的查找；如果没有同时出现using where，表明索引用来读取数据而非执行查找动作。
Using where：表明使用了where过滤
Using join buffer：表明使用了连接缓存,比如说在查询的时候，多表join的次数非常多，那么将配置文件中的缓冲区的join buffer调大一些。
impossible where：where子句的值总是false，不能用来获取任何元组
select tables optimized away：在没有GROUPBY子句的情况下，基于索引优化MIN/MAX操作或者对于MyISAM存储引擎优化COUNT(*)操作，不必等到执行阶段再进行计算，查询执行计划生成的阶段即完成优化。
distinct：优化distinct操作，在找到第一匹配的元组后即停止找同样值的动作