18.索引

本文最后更新于:2021年10月1日 晚上

索引

简介

  • MySQL官方对索引的定义:索引是帮助MySQL获取数据的数据结构

分类

主键索引(primary key)

  • 主键的列值唯一、不可为空
  • 唯一的标识,只能有一个列作为主键

唯一索引(unique key)

  • 索引的列值必须唯一,可以为空
  • 多个列都可以设置为唯一索引

如果是组合索引,则列值的组合必须唯一

常规索引(key/index)

  • 最基本的索引,不具备唯一性,仅加快查询速度。

全文索引(FullText)

  • 在特定的数据库引擎才有
  • 快速定位数据

是目前搜索引擎使用的一种关键技术。它能够利用多种算法智能分析出文本文字中关键词的频率和重要性,然后按照一定的算法规则智能筛选出想要的结果。3.2开始支持全文索引,但无法正确支持中文;5.7.6开始内置ngram全文检索插件,用来支持中文。

旧版的全文索引只能用在MyISAM数据库引擎的表上,但5.6.24上InnoDB也加入了全文索引。不够只支持char、varchar和text的字段类型。

使用

创建表时给字段增加索引

1
2
3
primary key xx()
unique key xx()
key xx()

创建完毕后增加索引

1
2
3
4
alter table 表名 add fulltext index 索引名(列名)		-- 添加全文索引

---------------
create 索引类型 on 表名(列名) --

显示表所有的索引信息

1
show index from 表名		-- 显示表中所有索引信息

索引原则

  • 索引不是越多越好
  • 不要对经常变动的数据加索引
  • 小数据量的表不需要加索引
  • 索引一般加在常用来查询的字段上

explain简介(拓展)

explain模拟优化器执行SQL语句,在5.6以及以后的版本中,select update delete insert均可用,从而知道mysql是如何处理sql语句,分析查询语句或者表结构的性能瓶颈。

作用

  1. 表的读取顺序
  2. 数据读取操作的操作类型
  3. 哪些索引可以使用
  4. 哪些索引被实际使用
  5. 表之间的引用
  6. 每张表有多少行被优化器查询

用法

explain+SQL语句

  • 执行计划包含的信息:
信息 描述
id 查询的序号,包含一组数字,表示查询中执行select子句或操作表的顺序
select_type 查询类型,主要用于区别普通查询,联合查询,子查询等的复杂查询
table 输出的行所引用的表
type 显示联结类型,显示查询使用了何种类型,按照从最佳到最坏类型排序
possible_keys 指出MySQL能使用哪个索引在该表中找到行
key 显示MySQL实际决定使用的键(索引)
key_len 表示索引中使用的字节数
ref 显示索引的哪一列被使用了,如果有可能是一个常数,哪些列或常量被用于查询索引列上的值
rows 根据表统计信息以及索引选用情况,大致估算出找到所需的记录所需要读取的行数
Extra 包含不适合在其他列中显示,但是十分重要的额外信息
  • **id:**id相同,执行顺序从上往下;id不同,id值越大,优先级越高,越先执行

  • select_type

    • simple ——简单的select查询,查询中不包含子查询或者UNION
    • primary ——查询中若包含任何复杂的子部分,最外层查询被标记
    • subquery——在select或where列表中包含了子查询
    • derived——在from列表中包含的子查询被标记为derived(衍生),MySQL会递归执行这些子查询,把结果放到临时表中
    • union——如果第二个select出现在UNION之后,则被标记为UNION,如果union包含在from子句的子查询中,外层select被标记为derived
    • union result: UNION 的结果
  • type:

    • system:表中仅有一行(=系统表)这是const联结类型的一个特例。

    • const:表示通过索引一次就找到,const用于比较primary key或者unique索引。因为只匹配一行数据,所以如果将主键置于where列表中,mysql能将该查询转换为一个常量

    • eq_ref:唯一性索引扫描,对于每个索引键,表中只有一条记录与之匹配。常见于唯一索引或者主键扫描

    • ref:非唯一性索引扫描,返回匹配某个单独值的所有行,本质上也是一种索引访问,它返回所有匹配某个单独值的行,可能会找多个符合条件的行,属于查找和扫描的混合体

    • range:只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引,一般就是where语句中出现了between,in等范围的查询。这种范围扫描索引扫描比全表扫描要好,因为它开始于索引的某一个点,而结束另一个点,不用全表扫描

    • index:index 与all区别为index类型只遍历索引树。通常比all快,因为索引文件比数据文件小很多。

    • all:遍历全表以找到匹配的行

    注意:一般保证查询至少达到range级别,最好能达到ref。\

  • key: 如果没有选择索引,键是NULL。查询中如果使用覆盖索引,则该索引和查询的select字段重叠。

  • key_length: 该列计算查询中使用的索引的长度在不损失精度的情况下,长度越短越好。

    ​ 如果键是NULL,则长度为NULL。该字段显示为索引字段的最大可能长度,并非实际使用长度。

  • Extra:

    • Using filesort:说明mysql会对数据适用一个外部的索引排序。而不是按照表内的索引顺序进行读取。MySQL中无法利用索引完成排序操作称为“文件排序”

    • Using temporary: 使用了临时表保存中间结果。mysql在查询结果排序时使用临时表,常见于排序order by和分组查询group by

    • Using index: 表示相应的select操作用使用覆盖索引,避免访问了表的数据行。

      ​ 如果同时出现using where,表名索引被用来执行索引键值的查找;如果没有同时出现using where,表名索引用来读取数据而非执行查询动作。

    • Using where : 表明使用where过滤

    • using join buffer: 使用了连接缓存

    • impossible where: where子句的值总是false,不能用来获取任何元组

    • select tables optimized away:在没有group by子句的情况下,基于索引优化Min、max操作或者对于MyISAM存储引擎优化count(*),不必等到执行阶段再进行计算,查询执行计划生成的阶段即完成优化

    • distinct:优化distinct操作,在找到第一匹配的元组后即停止找同样值的动作。

索引的数据结构(扩展)

阅读:https://blog.codinglabs.org/articles/theory-of-mysql-index.html


本博客所有文章除特别声明外,均采用 CC BY-SA 4.0 协议 ,转载请注明出处!