一、背景
先要从 InnoDB 的索引实现说起,InnoDB 有两大类索引:
-
聚集索引 (clustered index)
-
普通索引 (secondary index)
InnoDB 聚集索引和普通索引有什么差异?
InnoDB 普通索引 的叶子节点存储主键值。
注意:只有 InnoDB 普通索引才存储主键值,MyISAM 的二级索引都是直接指向数据块的。
InnoDB 聚集索引 的叶子节点存储行记录,因此,InnoDB 必须要有,且只有一个聚集索引:
如果表定义了主键,则主键就是聚集索引;
如果表没有定义主键,则第一个 not null 的 unique 列是聚集索引;
否则,InnoDB 会创建一个隐藏的 row-id 作为聚集索引;
注意:所以主键查询非常快,直接定位行记录。
二、什么是回表查询?
通俗的讲就是,如果索引的列在 select 所需获得的列中(因为在 mysql 中索引是根据索引列的值进行排序的,所以索引节点中存在该列中的部分值)或者根据一次索引查询就能获得记录就不需要回表,如果 select 所需获得列中有大量的非索引列,索引就需要到表中找到相应的列的信息,这就叫回表。
InnoDB聚集索引的叶子节点存储行记录,因此, InnoDB必须要有,且只有一个聚集索引:
(1)如果表定义了主键,则PK就是聚集索引;
(2)如果表没有定义主键,则第一个非空唯一索引(not NULL unique)列是聚集索引;
(3)否则,InnoDB会创建一个隐藏的row-id作为聚集索引;
三、可以举一个简单的例子
我有一张用于用户登录的user表:
字段名 | 类型 | 说明 |
---|---|---|
id | bigint(20) | 主键ID |
username | varchar(20) | 用户名 |
password | varchar(20) | 密码 |
假如现在有一个用户名为admin,密码为123的用户要登录,那我会先找出username为admin的那条用户数据
SELECT * FROM user WHERE username = 'admin'
再根据查出来的user信息去对比密码是否正确
这时你发现username字段是唯一的又经常作为where条件所以可以给username字段建一个索引,于是就给username建了一个普通的B+Tree索引。
这时候就出问题的,因为MySQL的InnoDB使用聚簇索引,具体的数据只和主键索引放在一起,其他的索引只存储了数据的地址(主键id)。
比如上面的例子中,我根据username索引找到的只是一个username为admin这条数据的id而不是这条数据信息,所以要找到整条数据信息要根据得到的id再去找。
看完上面的流程,你应该已经发现问题了,我要通过username找到id,再根据id找整条数据,这里有两个查找过程,这是影响效率的。就像上面的两个查找过程就是回表了。
四、解决办法
使用覆盖索引可以解决上面所说的回表的问题。
还是拿上面上面登录的例子来说,其实登录只需要判断用户名和密码,如果user表中有其他用户信息也是不需要的那我们能不能只查询一次就找到这个用户名对应的密码呢。
这个是可以的,上面所说的分两步查找,第一步根据username查找是肯定不能少的,那我们只要把password和索引username放到一起就可以了。我们可以建立一个(username、password)的组合索引,这里username一定要放在前面,然后我们把sql语句改一下
SELECT username, password FROM user WHERE username = 'admin'
或
SELECT password FROM user WHERE username = 'admin'