一、执行计划-type属性
执行计划的一条记录就代表着MySQL
对某个表的执行查询时的访问方法,其中的type
列就表明了这个访问这个单表的方法具体是什么,比方说下边这个查询:
- mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';
- +----+-------------+-------+------------+------+---------------+----------+---------+-------+------+----------+-------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+------+---------------+----------+---------+-------+------+----------+-------+
- | 1 | SIMPLE | s1 | NULL | ref | idx_key1 | idx_key1 | 303 | const | 8 | 100.00 | NULL |
- +----+-------------+-------+------------+------+---------------+----------+---------+-------+------+----------+-------+
- 1 row in set, 1 warning (0.04 sec)
可以看到type
列的值是ref
,表明MySQL
即将使用ref
访问方法来执行对s1
表的查询。我们针对使用InnoDB
存储引擎的表进行单表访问的方法如下:
- const,当我们根据主键或者唯一二级索引列与常数进行等值匹配时,对单表的访问方法就是
const(注意
对于唯一二级索引来说查询null值是不适用该访问方法的)。
- ref,当通过普通二级索引进行等值匹配时来查询某个表,那么对该表的访问方法就可能是
ref。
- ref_or_null,当对普通二级索引进行等值匹配查询,该索引列的值也可以是
NULL
值时,那么对该表的访问方法就可能是ref_or_null。
- mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a' OR key1 IS NULL;
- +----+-------------+-------+------------+-------------+---------------+----------+---------+-------+------+----------+-----------------------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+-------------+---------------+----------+---------+-------+------+----------+-----------------------+
- | 1 | SIMPLE | s1 | NULL | ref_or_null | idx_key1 | idx_key1 | 303 | const | 9 | 100.00 | Using index condition |
- +----+-------------+-------+------------+-------------+---------------+----------+---------+-------+------+----------+-----------------------+
- 1 row in set, 1 warning (0.01 sec)
-
range,如果使用普通二级索引获取某些
范围区间
的记录(包含IN、>和<等),那么就可能使用到range
访问方法。- mysql> EXPLAIN SELECT * FROM s1 WHERE key1 IN ('a', 'b', 'c');
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
- | 1 | SIMPLE | s1 | NULL | range | idx_key1 | idx_key1 | 303 | NULL | 27 | 100.00 | Using index condition |
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
- 1 row in set, 1 warning (0.01 sec)
-
index,当我们可以使用索引覆盖要查询的列,但需要扫描全部的索引记录时,该表的访问方法就是
index。下面
查询中的搜索列表中只有key_part2
一个列,而且搜索条件中也只有key_part3
一个列,这两个列又恰好包含在idx_key_part
这个索引中,可是搜索条件key_part3
不能直接使用该索引进行ref
或者range
方式的访问,只能扫描整个idx_key_part
索引的记录,所以查询计划的type
列的值就是index。
- mysql> EXPLAIN SELECT key_part2 FROM s1 WHERE key_part3 = 'a';
- +----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+--------------------------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+--------------------------+
- | 1 | SIMPLE | s1 | NULL | index | NULL | idx_key_part | 909 | NULL | 9688 | 10.00 | Using where; Using index |
- +----+-------------+-------+------------+-------+---------------+--------------+---------+------+------+----------+--------------------------+
- 1 row in set, 1 warning (0.00 sec)
- all,全表扫描。
二、执行计划-possible_keys和key属性
在EXPLAIN
语句输出的执行计划中,possible_keys
列表示在某个查询语句中,对某个表执行单表查询时可能用到的索引有哪些,key
列表示实际用到的索引有哪些,比方说下边这个查询:
- mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND key3 = 'a';
- +----+-------------+-------+------------+------+-------------------+----------+---------+-------+------+----------+-------------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+------+-------------------+----------+---------+-------+------+----------+-------------+
- | 1 | SIMPLE | s1 | NULL | ref | idx_key1,idx_key3 | idx_key3 | 303 | const | 6 | 2.75 | Using where |
- +----+-------------+-------+------------+------+-------------------+----------+---------+-------+------+----------+-------------+
- 1 row in set, 1 warning (0.01 sec)
上述执行计划的possible_keys
列的值是idx_key1,idx_key3
,表示该查询可能使用到idx_key1,idx_key3
两个索引,然后key
列的值是idx_key3
,表示经过查询优化器计算使用不同索引的成本后,最后决定使用idx_key3
来执行查询比较划算。所以possible_keys列中的值并不是越多越好,可能使用的索引越多,查询优化器计算查询成本时就得花费更长时间,所以如果可以的话,尽量删除那些用不到的索引。
注意:有时候,使用index
访问方法来查询某个表时,possible_keys
列是空的,而key
列展示的是实际使用到的索引。
三、执行计划-key_len属性
key_len
列表示当优化器决定使用某个索引执行查询时,该索引记录的最大长度。它是由这三个部分构成的:
-
对于使用固定长度类型的索引列来说,它实际占用的存储空间的最大长度就是该固定值,对于指定字符集的变长类型的索引列来说,比如某个索引列的类型是
VARCHAR(100)
,使用的字符集是utf8(每个字符三个字节)
,那么该列实际占用的最大存储空间就是100 × 3 = 300
个字节。 -
如果该索引列可以存储
NULL
值,则key_len
比不可以存储NULL
值时多1个字节。 -
对于变长字段来说,都会有2个字节的空间来存储该变长列的实际长度。
比如下边这个查询:
- mysql> EXPLAIN SELECT * FROM s1 WHERE id = 5;
- +----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
- | 1 | SIMPLE | s1 | NULL | const | PRIMARY | PRIMARY | 4 | const | 1 | 100.00 | NULL |
- +----+-------------+-------+------------+-------+---------------+---------+---------+-------+------+----------+-------+
- 1 row in set, 1 warning (0.01 sec)
由于id
列的类型是INT
,并且不可以存储NULL
值,所以在使用该列的索引时key_len
大小就是4
。当索引列可以存储NULL
值时,key_len
列就变成了5
,比使用id
列的索引时多了1
。
对于可变长度的索引列来说,比如key1
列的类型是VARCHAR(100)
,所以该列实际最多占用的存储空间就是300
字节,又因为该列允许存储NULL
值,所以key_len
需要加1
,又因为该列是可变长度列,所以key_len
需要加2
,所以最后ken_len
的值就是303
。
key_len
列主要是为了让我们区分某个使用联合索引的查询具体用了几个索引列,比如idx_key_part 这个联合索引如果只用到了联合索引前两个索引列,长度显示就是606。
四、执行计划-ref属性
当使用索引列等值匹配的条件去执行查询时,也就是在访问方法(type)是const
、ref
、ref_or_null
其中之一时,ref
列展示的就是与索引列作等值匹配的值得类型,比如只是一个常数或者是某个列。const代表常数,某一列名(数据库名称.s1.id)代表匹配的是一列,func代表匹配的是函数。
- mysql> EXPLAIN SELECT * FROM s1 WHERE key1 = 'a';
- +----+-------------+-------+------------+------+---------------+----------+---------+-------+------+----------+-------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+------+---------------+----------+---------+-------+------+----------+-------+
- | 1 | SIMPLE | s1 | NULL | ref | idx_key1 | idx_key1 | 303 | const | 8 | 100.00 | NULL |
- +----+-------------+-------+------------+------+---------------+----------+---------+-------+------+----------+-------+
- 1 row in set, 1 warning (0.01 sec)
可以看到ref
列的值是const
,表明在使用idx_key1
索引执行查询时,与key1
列作等值匹配的对象是一个常数。
- mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.id = s2.id;
- +----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
- | 1 | SIMPLE | s1 | NULL | ALL | PRIMARY | NULL | NULL | NULL | 9688 | 100.00 | NULL |
- | 1 | SIMPLE | s2 | NULL | eq_ref | PRIMARY | PRIMARY | 4 | mytest.s1.id | 1 | 100.00 | NULL |
- +----+-------------+-------+------------+--------+---------------+---------+---------+-----------------+------+----------+-------+
- 2 rows in set, 1 warning (0.00 sec)
可以看到对被驱动表s2
的访问方法是eq_ref
,而对应的ref
列的值是mytest.s1.id
,这说明在对被驱动表进行访问时会用到PRIMARY
索引,也就是聚簇索引与一个列进行等值匹配的条件,于s2
表的id
作等值匹配的对象就是mytest.s1.id
列(注意这里把数据库名也写出来了)。
五、执行计划-rows属性
如果查询优化器决定使用全表扫描的方式对某个表执行查询时,执行计划的rows
列就代表预计需要扫描的行数,如果使用索引来执行查询时,执行计划的rows
列就代表预计扫描的索引记录行数。比如下边这个查询:
- mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z';
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
- | 1 | SIMPLE | s1 | NULL | range | idx_key1 | idx_key1 | 303 | NULL | 266 | 100.00 | Using index condition |
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+-----------------------+
- 1 row in set, 1 warning (0.00 sec)
我们看到执行计划的rows
列的值是266
,这意味着查询优化器在经过分析使用idx_key1
进行查询的成本之后,觉得满足key1 > 'z'
这个条件的记录只有266
条。
六、执行计划-filtered属性
之前在分析连接查询的成本时,知道了MySQL
在计算驱动表扇出时采用的一个策略:
-
如果使用的是全表扫描的方式执行的单表查询,那么计算驱动表扇出时需要估计出满足搜索条件的记录到底有多少条。
-
如果使用的是索引执行的单表扫描,那么计算驱动表扇出的时候需要估计出满足除使用到对应索引的搜索条件外的其他搜索条件的记录有多少条。
比方说下边这个查询:
- mysql> EXPLAIN SELECT * FROM s1 WHERE key1 > 'z' AND common_field = 'a';
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+------------------------------------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+------------------------------------+
- | 1 | SIMPLE | s1 | NULL | range | idx_key1 | idx_key1 | 303 | NULL | 266 | 10.00 | Using index condition; Using where |
- +----+-------------+-------+------------+-------+---------------+----------+---------+------+------+----------+------------------------------------+
- 1 row in set, 1 warning (0.00 sec)
从执行计划的key
列中可以看出来,该查询使用idx_key1
索引来执行查询,从rows
列可以看出满足key1 > 'z'
的记录有266
条。执行计划的filtered
列就代表查询优化器预测在这266
条记录中,有多少条记录满足其余的搜索条件,也就是common_field = 'a'
这个条件的百分比。此处filtered
列的值是10.00
,说明查询优化器预测在266
条记录中有10.00%
的记录满足common_field = 'a'
这个条件。对于单表查询来说,这个filtered
列的值没什么意义,我们更关注在连接查询中驱动表对应的执行计划记录的filtered
值。比如以上SQL内连接S2表,那么S1作为驱动表,这个10%就很有意义,就代表了要对s2表进行多少次查询。
- mysql> EXPLAIN SELECT * FROM s1 INNER JOIN s2 ON s1.key1 = s2.key1 WHERE s1.common_field = 'a';
- +----+-------------+-------+------------+------+---------------+----------+---------+-------------------+------+----------+-------------+
- | id | select_type | table | partitions | type | possible_keys | key | key_len | ref | rows | filtered | Extra |
- +----+-------------+-------+------------+------+---------------+----------+---------+-------------------+------+----------+-------------+
- | 1 | SIMPLE | s1 | NULL | ALL | idx_key1 | NULL | NULL | NULL | 9688 | 10.00 | Using where |
- | 1 | SIMPLE | s2 | NULL | ref | idx_key1 | idx_key1 | 303 | xiaohaizi.s1.key1 | 1 | 100.00 | NULL |
- +----+-------------+-------+------------+------+---------------+----------+---------+-------------------+------+----------+-------------+
- 2 rows in set, 1 warning (0.00 sec)
从执行计划中可以看出来,查询优化器打算把s1
当作驱动表,s2
当作被驱动表。我们可以看到驱动表s1
表的执行计划的rows
列为9688
, filtered
列为10.00
,这意味着驱动表s1
的扇出值就是9688 × 10.00% = 968.8
,这说明还要对被驱动表执行大约968
次查询。
七、执行计划-Extra属性
Extra
列是用来说明一些额外信息的,我们可以通过这些额外信息来更准确的理解MySQL
到底将如何执行给定的查询语句。MySQL
提供的额外信息有好几十个,我们举例一部分说明。
- No tables used,当查询语句的没有
FROM
子句时将会提示该额外信息。 - Impossible WHERE,查询语句的
WHERE
子句永远为FALSE
时将会提示该额外信息。 - Using index,当我们的查询列表以及搜索条件中只包含属于某个索引的列,也就是在可以使用索引覆盖的情况下不需要进行回表操作,在
Extra
列将会提示该额外信息。 - Using index condition,有些搜索条件中虽然出现了索引列,但却不能使用到索引,比如左模糊查询。
- Using where,当我们使用全表扫描来执行对某个表的查询,并且该语句的
WHERE
子句中有针对该表的搜索条件。 - Using join buffer (Block Nested Loop),在连接查询执行过程中,当被驱动表不能有效的利用索引加快访问速度,
MySQL
一般会为其分配一块名叫join buffer
的内存块来加快查询速度。 - Using temporary,在许多查询的执行过程中,
MySQL
可能会借助临时表来完成一些功能,比如去重、排序之类的,比如我们在执行许多包含DISTINCT
、GROUP BY
、UNION
等子句的查询过程中,如果不能有效利用索引来完成查询,MySQL
很有可能寻求通过建立内部的临时表来执行查询。如果查询中使用到了内部的临时表,在执行计划的Extra
列将会显示Using temporary
提示。