MySQL的ORDER BY优化

除了常规的Join语句之外,还有一类Query语句也是使用比较频繁的,那就是ORDER BY,GROUP BY以及DISTINCT这三类查询。考虑到这三类查询都涉及到数据的排序等操作,所以我将他们放在了一起,下面就针对这三类Query语句做基本的分析。

一、ORDER BY的实现与优化

1、在MySQL中,ORDER BY的实现有如下两种类型:
◆ 一种是通过有序索引而直接取得有序的数据,这样不用进行任何排序操作即可得到满足客户端要求的有序数据返回给客户端;
◆ 另外一种则需要通过MySQL的排序算法将存储引擎中返回的数据进行排序然后再将排序后的数据返回给客户端。

2、第一种情况:
这种利用索引实现数据排序的方法是MySQL中实现结果集排序的最佳做法,可以完全避免因为排序计算所带来的资源消耗。所以,在我们优化Query语句中的ORDER BY的时候,尽可能利用已有的索引来避免实际的排序计算,可以很大幅度的提升ORDER BY操作的性能。

继续阅读MySQL的ORDER BY优化

MySQL Join的实现原理及优化思路

一、Join的实现原理

在MySQL中,只有一种Join算法,就是大名鼎鼎的Nested Loop Join,他没有其他很多数据库所提供的Hash Join,也没有Sort Merge Join。顾名思义,Nested Loop Join实际上就是通过驱动表的结果集作为循环基础数据,然后一条一条的通过该结果集中的数据作为过滤条件到下一个表中查询数据,然后合并结果。如果还有第三个参与Join,则再通过前两个表的Join结果集作为循环基础数据,再一次通过循环查询条件到第三个表中查询数据,如此往复。

MySQL 8.0支持Hash Join了。

二、Join语句的优化

1、尽可能减少Join语句中的Nested Loop的循环总次数
如何减少Nested Loop的循环总次数?最有效的办法只有一个,那就是让驱动表的结果集尽可能的小,这也正是优化基本原则之一“永远用小结果集驱动大的结果集”。

2、优先优化Nested Loop的内层循环
不仅仅是在数据库的Join中应该做的,实际上在我们优化程序语言的时候也有类似的优化原则。内层循环是循环中执行次数最多的,每次循环节约很小的资源,在整个循环中就能节约很大的资源。

继续阅读MySQL Join的实现原理及优化思路

MySQL索引使用

一、索引的利处
很多朋友对数据库中的索引的认识可能主要还是只限于“能够提高数据检索的效率,降低数据库的IO成本”。

确实,在数据库中个表的某个字段创建索引,所带来的最大益处就是将该字段作为检索条件的时候可以极大的提高检索效率,加快检索时间,降低检索过程中所需要读取的数据量。但是索引所给我们带来的收益只是提高表数据的检索效率吗?当然不是,索引还有一个非常重要的用途,那就是降低数据的排序成本。

我们知道,每个索引中索引数据都是按照索引键键值进行排序后存放的,所以,当我们的Query语句中包含排序分组操作的时候,如果我们的排序字段和索引键字段刚好一致,MySQL Query Optimizer就会告诉mysqld在取得数据之后不用排序了,因为根据索引取得的数据已经是满足客户的排序要求。

那如果是分组操作呢?分组操作没办法直接利用索引完成。但是分组操作是需要先进行排序然后才分组的,所以当我们的Query语句中包含分组操作,而且分组字段也刚好和索引键字段一致,那么mysqld同样可以利用到索引已经排好序的这个特性而省略掉分组中的排序操作。

继续阅读MySQL索引使用

MySQL索引类型

在MySQL中,主要有四种类型的索引,分别为:B-Tree索引,Hash索引,Fulltext索引和R-Tree索引。

一、B-Tree索引

B-Tree索引是MySQL数据库中使用最为频繁的索引类型,除了Archive存储引擎之外的其他所有的存储引擎都支持B-Tree索引。不仅仅在MySQL中是如此,实际上在其他的很多数据库管理系统中B-Tree索引也同样是作为最主要的索引类型,这主要是因为B-Tree索引的存储结构在数据库的数据检索中有非常优异的表现。

一般来说,MySQL中的B-Tree索引的物理文件大多都是以Balance Tree的结构来存储的,也就是所有实际需要的数据都存放于Tree的Leaf Node,而且到任何一个Leaf Node的最短路径的长度都是完全相同的,所以我们大家都称之为B-Tree索引。当然,可能各种数据库(或MySQL的各种存储引擎)在存放自己的B-Tree索引的时候会对存储结构稍作改造。如Innodb存储引擎的B-Tree索引实际使用的存储结构实际上是B+Tree,也就是在B-Tree数据结构的基础上做了很小的改造,在每一个Leaf Node上面除了存放索引键的相关信息之外,还存储了指向与该Leaf Node相邻的后一个Leaf Node的指针信息,这主要是为了加快检索多个相邻Leaf Node的效率考虑。

继续阅读MySQL索引类型

MySQL Profiler使用

要想优化一条Query,我们就需要清楚的知道这条Query的性能瓶颈到底在哪里,是消耗的CPU计算太多,还是需要的的IO操作太多?

MySQL的Query Profiler是一个使用非常方便的Query诊断分析工具,通过该工具可以获取一条Query在整个执行过程中多种资源的消耗情况,如CPU,IO,IPC,SWAP等,以及发生的PAGE FAULTS,CONTEXT SWITCHE等等,同时还能得到该Query执行过程中MySQL所调用的各个函数在源文件中的位置。

1、打开profiling参数


mysql> set profiling=1;
Query OK, 0 rows affected, 1 warning (0.00 sec)

2、查询sql语句


mysql> select count(*) from t_crcs_check_diff;
+----------+
| count(*) |
+----------+
|    12608 |
+----------+
1 row in set (0.01 sec)

继续阅读MySQL Profiler使用

MySQL Explain使用

MySQL Query Optimizer通过我让们执行EXPLAIN命令来告诉我们他将使用一个什么样的执行计划来优化我们的Query。所以,可以说Explain是在优化Query时最直接有效的验证我们想法的工具。

在我们对某个Query优化过程中,需要不断的使用Explain来验证我们的各种调整是否有效。

一、我们先看一下在MySQL Explain功能中给我们展示的各种信息的解释:

1、ID:Query Optimizer所选定的执行计划中查询的序列号;

2、Select_type:所使用的查询类型,主要有以下这几种查询类型
1)DEPENDENT SUBQUERY:子查询中内层的第一个SELECT,依赖于外部查询的结果集;
2)DEPENDENT UNION:子查询中的UNION,且为UNION中从第二个SELECT开始的后面所有SELECT,同样依赖于外部查询的结果集;
3)PRIMARY:子查询中的最外层查询,注意并不是主键查询;
4)SIMPLE:除子查询或者UNION之外的其他查询;
5)SUBQUERY:子查询内层查询的第一个SELECT,结果不依赖于外部查询结果集;
6)UNCACHEABLE SUBQUERY:结果集无法缓存的子查询;
7)UNION:UNION语句中第二个SELECT开始的后面所有SELECT,第一个SELECT为PRIMARY;
8)UNION RESULT:UNION中的合并结果;

继续阅读MySQL Explain使用

oracle 19c学习(2)—导入10g数据库dmp文件

1、执行
CREATE USER c##posp IDENTIFIED BY posp;
ALTER USER c##posp QUOTA UNLIMITED ON USERS;
GRANT "CONNECT" TO c##posp;
GRANT "RESOURCE" TO c##posp;
GRANT CREATE ANY INDEX TO c##posp;
GRANT CREATE VIEW TO c##posp;
GRANT CREATE SESSION TO c##posp;
grant read,write on directory dmpdir to c##posp;

impdp c##posp/posp schemas=posp3 remap_schema=posp3:c##posp directory=dmpdir dumpfile=expdp_posp3.dmp logfile=impdp.log job_name=my_jod;

2、导入过程中提示错误
ORA-02374: conversion error loading table "C##POSP"."TBL_IPC_DFT_DSP"
ORA-12899: value too large for column IPC_DFT (actual: 266, maximum: 256)

ORA-02372: data for row: IPC_DFT : 0X'B9A4C9CCD2F8D0D0B3E5D5FDBDBBD2D7C7EBC7F32020202020'
因为字符集不一样
目标数据库字符集:al32utf8
源数据库字符集:zhs16gbk

没办法。。。

oracle 19c学习(1)—CentOS7 rpm包安装oracle19c

oracle19c相当于10g、11g后的12号版本的长期支持版,并且提供了rpm包安装,大大简化了安装过程

1、下载预安装包
wget http://yum.oracle.com/repo/OracleLinux/OL7/latest/x86_64/getPackage/oracle-database-preinstall-19c-1.0-1.el7.x86_64.rpm

2、下载oracle 19c
https://www.oracle.com/database/technologies/oracle-database-software-downloads.html#19c

3、安装预安装包
yum -y localinstall /root/oracle-database-preinstall-19c-1.0-1.el7.x86_64.rpm
会自动安装oracle的依赖包

4、安装oracle
yum -y localinstall /root/oracle-database-ee-19c-1.0-1.x86_64.rpm

继续阅读oracle 19c学习(1)—CentOS7 rpm包安装oracle19c

MySQL的Query语句优化

一、Query Optimizer

1、MySQL Query Optimizer是什么
是MySQL查询语句优化器,其主要的功能就是通过计算分析系统中收集的各种统计信息,为客户端请求的Query给出他认为最优的执行计划,也就是他认为最优的数据检索方式。

2、MySQL Query Optimizer基本工作原理
MySQL的Query Tree是通过优化实现DBXP的经典数据结构和Tree构造器而生成的一个指导完成一个Query语句的请求所需要处理的工作步骤,我们可以简单的认为就是一个的数据处理流程规划,只不过是以一个Tree的数据结构存放而已。通过Query Tree我们可以很清楚的知道一个Query的完成需要经过哪些步骤的处理,每一步的数据来源在哪里,处理方式是怎样的。

当客户端向MySQL请求一条Query ,到命令解析器模块完成请求分类区别出是SELECT并转发给Query Optimizer之后,Query Optimizer首先会对整条Query进行,优化处理掉一些常量表达式的预算,直接换算成常量值。并对Query中的查询条件进行简化和转换,如去掉一些无用或者显而易见的条件,结构调整等等。然后则是分析Query中的Hint信息(如果有),看显示Hint信息是否可以完全确定该Query的执行计划。如果没有Hint或者Hint信息还不足以完全确定执行计划,则会读取所涉及对象的统计信息,根据Query进行写相应的计算分析,然后再得出最后的执行计划。

继续阅读MySQL的Query语句优化

项目管理案例讨论10

某系统集成公司最近承接了一个项目,客户是该公司的老主顾。当时公司的总经理急着要出差,所以在软件模块界定和验收标准还不明确的情况下,就和客户签订了合同,并任命张工为这个项目的项目经理。

经过紧张的准备,项目终于启动了。第一个阶段结束后,在结果评估时,双方发生了分歧。客户认为模块中缺少一部分功能,而张工认为客户提出的功能在合同之外,如果要做,就要做项目变更,重新核算成本。由于合同中对此内容的界定不明确,双方各执一词,僵持不下,客户拒绝验收,项目的回款眼瞅着要泡汤。

后来项目组的程序员小王请求张工为他增派人手,说他的任务完不成了,可张工安排给他的工作已经做完了。经过了解,张工才知道,客户小刘几次请小王开发一些小的模块,小王也没向张工请示,就自作主张给做了。这次,他又答应在客户原有的模块上增加统计功能,结果做起来才发现实现不了,这才向张工求救。张工赶紧和客户沟通,要求作项目变更,可客户咬死说前几次都是免费的,这次也应该免费。

[问题1]张工所负责的项目在变更管理中存在哪些问题?
(1)在项目功能和标准不明确的时候就签订了合同,为后来的项目变更埋下了隐患
(2)没有建立项目变更管理制度
(3)涉及变更开发人员随便答应,没有上报给项目经理
(4)变更请求没有经过评估,没有评估产生的费用和技术要求,也没有签字确认,采用口头协议
(5)变更实施时没有考虑对系统其他功能的影响,也没有考虑能否实现
(6)变更后没有进行验证
(7)没有对变更后的内容进行存档,也没有通知给相关的项目干系人

继续阅读项目管理案例讨论10

软件及互联网爱好者