SQL 百分网手机站

SQL优化(2)

时间:2018-01-18 17:55:08 SQL 我要投稿

SQL优化大全

  6. 数据量的问题

  30).尽量避免向客户端返回大数据量,若数据量过大,应该考虑相应需求是否合理。

  7. COUNT优化:

  31) count(*) 优于count(1)和count(primary_key)

  很多人为了统计记录条数,就使用 count(1) 和 count(primary_key) 而不是 count(*) ,他们认为这样性能更好,其实这是一个误区。对于有些场景,这样做可能性能会更差,应为数据库对 count(*) 计数操作做了一些特别的优化。

  32)count(column) 和 count(*) 是不一样的

  这个误区甚至在很多的资深工程师或者是 DBA 中都普遍存在,很多人都会认为这是理所当然的。实际上,count(column) 和 count(*) 是一个完全不一样的操作,所代表的意义也完全不一样。

  count(column) 是表示结果集中有多少个column字段不为空的记录

  count(*) 是表示整个结果集有多少条记录

  1)innodb引擎在统计方面和myisam是不同的,Myisam内置了一个计数器,

  Count(*)在没有查询条件的情况下使用 select count(*) from table 的时候,Myisam直接可以从计数器中取出数据。而innodb必须全表扫描一次方能得到总的数量

  2. 但是当有查询条件的时候,两者的查询效率一致。

  4. 主键索引count(*)的时候之所以慢

  InnoDB引擎:

  [1]     数据文件和索引文件存储在一个文件中,主键索引默认直接指向数据存储位置。

  [2]     二级索引存储指定字段的索引,实际的指向位置是主键索引。当我们通过二级索引统计数据的时候,无需扫描数据文件;而通过主键索引统计数据时,由于主键索引与数据文件存放在一起,所以每次都会扫描数据文件,所以主键索引统计没有二级索引效率高。

  [3]     由于主键索引直接指向实际数据,所以当我们通过主键id查询数据时要比通过二级索引查询数据要快。

  l  MyAsm引擎

  [1]     该引擎把每个表都分为几部分存储,比如用户表,包含user.frm,user.MYD和user.MYI。

  [2]     User.frm负责存储表结构

  [3]     User.MYD负责存储实际的数据记录,所有的用户记录都存储在这个文件中

  [4]     User.MYI负责存储用户表的所有索引,这里也包括主键索引。

  8. 优化order by语句

  基于索引的排序

  MySQL的弱点之一是它的排序。虽然MySQL可以在1秒中查询大约15,000条记录,但由于MySQL在查询时最多只能使用一个索引。因此,如果WHERE条件已经占用了索引,那么在排序中就不使用索引了,这将大大降低查询的速度。我们可以看看如下的SQL语句:

  SELECT * FROM SALES WHERE NAME = “name” ORDER BY SALE_DATE DESC;

  在以上的SQL的WHERE子句中已经使用了NAME字段上的索引,因此,在对SALE_DATE进行排序时将不再使用索引。为了解决这个问题,我们可以对SALES表建立复合索引:

  ALTER TABLE SALES DROP INDEX NAME, ADD INDEX (NAME,SALE_DATE)

  这样再使用上述的SELECT语句进行查询时速度就会大副提升。但要注意,在使用这个方法时,要确保WHERE子句中没有排序字段,在上例中就是不能用SALE_DATE进行查询,否则虽然排序快了,但是SALE_DATE字段上没有单独的索引,因此查询又会慢下来。

  在某些情况中, MySQL可以使用一个索引来满足 ORDER BY子句,而不需要额外的排序。 where条件和order by使用相同的索引,并且order by 的顺序和索引顺序相 同,并且order by的字段都是升序或者都是降序。例如:下列sql可以使用索引。

  SELECT * FROM t1 ORDER BY key_part1,key_part2,... ;

  SELECT * FROM t1 WHERE key_part1=1 ORDER BY key_part1 DESC, key_part2 DESC;

  SELECT * FROM t1 ORDER BY key_part1 DESC, key_part2 DESC;

  但是以下情况不使用索引:

  SELECT * FROM t1 ORDER BY key_part1 DESC, key_part2 ASC ; --order by 的字段混合 ASC 和 DESC

  SELECT * FROM t1 WHERE key2=constant ORDER BY key1 ;-- 用于查询行的关键字与 ORDER BY 中所使用的不相同

  SELECT * FROM t1 ORDER BY key1, key2 ;-- 对不同的关键字使用 ORDER BY :

  9. 优化GROUP BY

  默认情况下, MySQL 排序所有 GROUP BY col1 , col2 , .... 。查询的方法如同在查询中指定 ORDER BY col1 , col2 , ... 。如果显式包括一个包含相同的列的 ORDER BY

  子句, MySQL 可以毫不减速地对它进行优化,尽管仍然进行排序。如果查询包括 GROUP BY 但你想要避免排序结果的消耗,你可以指定 ORDER BY NULL禁止排序。

  例如 :

  INSERT INTO foo  SELECT a, COUNT(*) FROM bar GROUP BY a ORDER BY NULL;

  10. 优化 OR

  具体详解看:mysql or条件可以使用索引而避免全表

  4. Explain解释说明

  explain显示了mysql如何使用索引来处理select语句以及连接表。可以帮助选择更好的索引和写出更优化的查询语句。

  使用方法,在select语句前加上explain就可以了:

  如:

  explain select surname,first_name form a,b where a.id=b.id

  分析结果形式如下:

  table |  type | possible_keys | key | key_len  | ref | rows | Extra

  EXPLAIN列的`解释:

  1 table:

  显示这一行的数据是关于哪张表的

  2 type:

  这是重要的列,显示连接使用了何种类型。从最好到最差的连接类型为:system、const、eg_reg、ref、ref_or_null、 range、indexhe、 ALL。

  system:表仅有一行(=系统表)。这是const联接类型的一个特例

  const:(PRIMARY KEY或UNIQUE)

  表最多有一个匹配行,它将在查询开始时被读取。因为仅有一行,在这行的列值可被优化器剩余部分认为是常数。

  const表很快,因为它们只读取一次!

  const用于用常数值比较PRIMARY KEY或UNIQUE索引的所有部分时。

  在下面的查询中,tbl_name可以用于const表:

  SELECT * from tbl_name WHERE primary_key=1;

  eq_reg:key

  对于每个来自于前面的表的行组合,从该表中读取一行。这可能是最好的联接类型,除了const类型。

  它用在一个索引的所有部分被联接使用并且索引是UNIQUE或PRIMARY KEY。

  eq_ref可以用于使用= 操作符比较的带索引的列。比较值可以为常量或一个使用在该表前面所读取的表的列的表达式。

  在下面的例子中,MySQL可以使用eq_ref联接来处理ref_tables:

  SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;

  SELECT * FROM ref_table,other_table WHERE ref_table.key_column_part1=other_table.column

  AND ref_table.key_column_part2=1;

  ref:key

  对于每个来自于前面的表的行组合,所有有匹配索引值的行将从这张表中读取。如果联接只使用键的最左边的前缀,

  或如果键不是UNIQUE或PRIMARY KEY(换句话说,如果联接不能基于关键字选择单个行的话),则使用ref。

  如果使用的键仅仅匹配少量行,该联接类型是不错的。

  ref可以用于使用=或<=>操作符的带索引的列。

  在下面的例子中,MySQL可以使用ref联接来处理ref_tables:

  SELECT * FROM ref_table WHERE key_column=expr;

  SELECT * FROM ref_table,other_table WHERE ref_table.key_column=other_table.column;

  SELECT * FROM ref_table,other_table WHERE ref_table.key_column_part1=other_table.column

  AND ref_table.key_column_part2=1;

  ref_or_null:Or Is null

  该联接类型如同ref,但是添加了MySQL可以专门搜索包含NULL值的行。在解决子查询中经常使用该联接类型的优化。

  在下面的例子中,MySQL可以使用ref_or_null联接来处理ref_tables:

  SELECT * FROM ref_table WHERE key_column=expr OR key_column IS NULL;

  range:=、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN或者IN

  只检索给定范围的行,使用一个索引来选择行。key列显示使用了哪个索引。

  key_len包含所使用索引的最长关键元素。在该类型中ref列为NULL。

  当使用=、<>、>、>=、<、<=、IS NULL、<=>、BETWEEN或者IN操作符,用常量比较关键字列时,可以使用range:

  SELECT * FROM tbl_name WHERE key_column = 10;

  SELECT * FROM tbl_name WHERE key_column BETWEEN 10 and 20;

  SELECT * FROM tbl_name WHERE key_column IN (10,20,30);

  SELECT * FROM tbl_name WHERE key_part1= 10 AND key_part2 IN (10,20,30);

  indexhe:

  该联接类型与ALL相同,除了只有索引树被扫描。这通常比ALL快,因为索引文件通常比数据文件小。

  当查询只使用作为单索引一部分的列时,MySQL可以使用该联接类型。

  ALL:

  对于每个来自于先前的表的行组合,进行完整的表扫描。如果表是第一个没标记const的表,

  这通常不好,并且通常在它情况下很差。通常可以增加更多的索引而不要使用ALL,

  使得行能基于前面的表中的常数值或列值被检索出。

  3 possible_keys :

  显示可能应用在这张表中的索引。如果为空,没有可能的索引。可以为相关的域从WHERE语句中

  选择一个合适的语句

  4 key :

  实际使用的索引。如果为NULL,则没有使用索引。很少的情况下,MYSQL会选择优化不足的索引  。

  这种情况下,可以在SELECT语句中使用USEINDEX(indexname)来强制使用一个索引或者用IGNORE INDEX(indexname)来强制MYSQL忽略索引

  5key_len:

  使用的索引的长度。在不损失精确性的情况下,长度越短越好

  6 ref

  显示索引的哪一列被使用了,如果可能的话,是一个常数

  7 rows

  MYSQL认为必须检查的用来返回请求数据的行数 (扫描行的数量)

  8 Extra

  该列包含MySQL解决查询的详细信息

  关于MYSQL如何解析查询的额外信息。将在表4.3中讨论,但这里可以看到的坏的例子是Using temporary和Using filesort,

  意思MYSQL根本不能使用索引,结果是检索会很慢

  extra列返回的描述的意义

  Distinct:

  一旦MYSQL找到了与行相联合匹配的行,就不再搜索了

  Not exists :

  MYSQL优化了LEFT JOIN,一旦它找到了匹配LEFT JOIN标准的行, 就不再搜索了

  面是一个可以这样优化的查询类型的例子:

  SELECT * FROM t1 LEFT JOIN t2 ON t1.id=t2.id WHERE t2.id IS NULL;

  假定t2.id定义为NOT NULL。在这种情况下,MySQL使用t1.id的值扫描t1并查找t2中的行。

  如果MySQL在t2中发现一个匹配的行,它知道t2.id绝不会为NULL,并且不再扫描t2内有相同的id值的行。

  换句话说,对于t1的每个行,MySQL只需要在t2中查找一次,无论t2内实际有多少匹配的行。

  Range checked for each Record(index map:#)

  没有找到理想的索引,因此对于从前面表中来的每一个行组合,MYSQL检查使用哪个索引,并用它来从表中返回行。

  这是使用索引的最慢的连接之一

  MySQL没有发现好的可以使用的索引,但发现如果来自前面的表的列值已知,可能部分索引可以使用。

  对前面的表的每个行组合,MySQL检查是否可以使用range或index_merge访问方法来索取行。

  关于适用性标准的描述参见7.2.5节,“范围优化”和7.2.6节,“索引合并优化”,

  不同的是前面表的所有列值已知并且认为是常量。这并不很快,但比执行没有索引的联接要快得多。

  Using filesort

  看到这个的时候,查询就需要优化了。MYSQL需要进行额外的步骤来发现如何对返回的行排序。

  它根据连接类型以及存储排序键值和匹配条件的全部行的行指针来排序全部行

  Using index

  列数据是从仅仅使用了索引中的信息而没有读取实际的行动的表返回的,

  这发生在对表的全部的请求列都是同一个索引的部分的时候

  Using temporary

  看到这个的时候,查询需要优化了。这里,MYSQL需要创建一个临时表来存储结果,这通常发生在对不同的列集进行ORDER BY上,而不是GROUP BY上

  Using where

  使用了WHERE从句来限制哪些行将与下一张表匹配或者是返回给用户。如果不想返回表中的全部行,

  并且连接类型ALL或index,这就会发生,或者是查询有问题

  Impossible WHERE noticed after reading const table...

【SQL优化大全】相关文章:

1.SQL语句优化的经验

2.SQL语句的优化问题教程

3.SQL语句编写与优化规范

4.sql语法大全

5.关于sql语句优化的知识

6.SQL优化过程中常见OracleHINT用法盘点

7.SQL语句优化方法详细介绍

8.经典SQL语句大全