一、MySQL索引的基础和类型
1.索引的基础
索引类似于书籍的目录,要想找到一本书的某个特定主题,需要先查找书的目录,定位对应的页码。
存储引擎使用类似的方式进行数据查询,先去索引当中找到对应的值,然后根据匹配的索引找到对应的数据行。
2.索引对性能的影响
优点:
大大减少服务器需要扫描的数据量
帮助服务器避免排序和临时表
将随机I/O变成顺序I/O
大大提高查询的速度
缺点:
降低写的速度、占用磁盘
3.索引的使用场景
对于非常小的表,大部分情况下全表扫描效率更高
中到大型表,索引非常有效
特大型的表,建立和使用索引的代价将随之增长,可以使用分区技术来解决
4.索引的类型
索引有很多中类型,都是实现在存储引擎层的
普通索引:最基本的索引,没有任何约束限制
唯一索引:与普通索引类似,但是具有唯一性约束
主键索引:特殊的唯一索引,不允许有空值
一个表只能有一个主键索引,可以有多个唯一索引
主键索引一定是唯一索引,唯一索引不是主键索引
主键可以与外键构成参照完整性约束,防止数据不一致
组合索引(复合索引):将多个列组合在一起创建索引,可以覆盖多个列
外键索引:只有InnoDB类型的表才可以使用外键索引,保证数据的一致性、完整性和实现级联操作
全文索引:MySQL自带的全文索引只能用于MyISAM,并且只能对英文进行全文索引
外键索引和全文索引不常用,一般外键索引的功能我们可以在程序逻辑中实现,全文索引可以使用ES等全文搜索引擎实现。
二、MySQL索引的创建原则
原则
1.最适合索引的列是出现在WHERE子句中的列,或连接字句中的列而不是出现在SELECT关键字后的列
比如 select id,email,tel from user where username = "xiaofan"; 这里我们应该选择 username 作为索引
2.索引列的基数越大,索引的效果越好
3.对字符串进行索引,应该制定一个前缀长度,可以节省大量的索引空间,这个就被称为前缀索引
比如,下面username长度比较长,如果创建完整的索引值,会影响索引效率。我们可以选择合适长度的前缀作为索引。下面选择username前5个字符作为索引
create table user( `id` int unsigned not null auto_increament primary key, `username` varchar(32) not null default '', KEY user_username(username(5)) );
4.根据情况创建复合索引,复合索引可以提交查询效率
比如,我们查找一本书的某一章下面的某一节内容,使用复合索引会大大提高查询效率
create table user( `id` INT UNSIGNED NOT NULL AUTO_INCREMENT PRIMARY KEY, `username` VARCHAR(32) NOT NULL DEFAULT '', `password` CHAR(32) NOT NULL DEFAULT '', UNIQUE user_username_password(`username`,`password`) );
也可以使用 KEY user_username_password(username,password),但是由于上面的表中用户名和密码是有唯一关联性的所以用UNIQUE更合适,效率更高。
5.避免创建过多索引,索引会额外占用磁盘空间,降低写操作效率
6.主键尽可能选择较短的数据类型,可以有效减少索引的磁盘占用提高查询效率
三、MySQL索引的注意事项
注意
1.复合索引遵循前缀原则
比如
KEY(a,b,c)
WHERE a = 1 and b = 2 and c = 3
WHERE a = 1 and b =2
WHERE a = 1
以上查询语句可以使用到定义的复合索引
WHERE b = 2 and c =3
WHERE a = 1 and c =3
以上这两个就是无法使用到复合索引
因为复合索引遵循前缀原则,只能从左到右依次查询
2.like查询,%不能在前,可以使用全文索引
比如
index user_username(username)
where name like "wang%" 这样可以使用索引
where name like "%wang%" 这样就不能使用索引了
3.column is null 可以使用索引
4.如果MySQL估计使用索引比全表扫描更慢,会放弃使用索引
5.如果 or 关键字前的条件中的列有索引,后面的没有,索引都不会被用到
6.列类型是字符串,查询时一定要给值加引号,否则索引失效
比如
name varchar(20)
where name = 100; //这里可能有个name值是100,查询时不带引号,索引会失效
正确写法是 where name = "100".