[转]oracle表空间的高水位线

oracle表段中的高水位线HWM

oracle在逻辑存储上分4个粒度:表空间,段,区和块。

块:是粒度最小的存储单位,oracle的块大小可以是8K~32K不等,包含标准磁盘上的一个或多个块。oracle每一次I/O操作也是按块来操作的,也就是说当oracle从数据文件读数据时,是读取多少个块,而不是多少行。每一个Block里可以包含多个row。

区:由一系列相邻的块而组成,这也是oracle空间分配的基本单位,举个例子来说,当我们创建一个表Dave时,首先oracle会分配一个区的空间给这个表,随着不断的insert数据到Dave,原来的这个区容不下插入的数据时,oracle是以区为单位进行扩展的,也就是说再分配多少个区给Dave,而不是多少个块。

段:是由一系列的区所组成,一般来说,当创建一个对象时(表,索引),就会分配一个段给这个对象。所以从某种意义上来说,段就是某种特定的数据。如:create table Dave,这个段就是数据段,而create index on Dave(NAME),oracle同样会分配一个段给这个索引,但这是一个索引段了。查询段的信息可以通过数据字典USER_SEGMENTS来获得。

表空间:包含段、区及块。表空间的数据物理上储存在其所在的数据文件中。一个数据库至少要有一个表空间。

在Oracle数据的存储中,可以把存储空间想象为一个水库,数据想象为水库中的水。水库中的水的位置有一条线叫做水位线,在Oracle中,这条线被称为高水位线(High-warter mark, HWM)。在数据库表刚建立的时候,由于没有任何数据,所以这个时候水位线是空的,也就是说HWM为最低值。当插入了数据以后,高水位线就会上涨,但是这里也有一个特性,就是如果你采用delete语句删除数据的话,数据虽然被删除了,但是高水位线却没有降低,还是你刚才删除数据以前那么高的水位。也就是说,这条高水位线在日常的增删操作中只会上涨,不会下跌。

下面我们来谈一下Oracle中Select语句的特性。Select语句会对表中的数据进行一次扫描,但是究竟扫描多少数据存储块呢,这个并不是说数据库中有多少数据,Oracle就扫描这么大的数据块,而是Oracle会扫描高水位线以下的数据块。现在来想象一下,如果刚才是一张刚刚建立的空表,你进行了一次Select操作,那么由于高水位线HWM在最低的0位置上,所以没有数据块需要被扫描,扫描时间会极短。而如果这个时候你首先插入了一千万条数据,然后再用delete语句删除这一千万条数据。由于插入了一千万条数据,所以这个时候的高水位线就在一千万条数据这里。后来删除这一千万条数据的时候,由于delete语句不影响高水位线,所以高水位线依然在一千万条数据这里。这个时候再一次用select语句进行扫描,虽然这个时候表中没有数据,但是由于扫描是按照高水位线来的,所以需要把一千万条数据的存储空间都要扫描一次,也就是说这次扫描所需要的时间和扫描一千万条数据所需要的时间是一样多的。所以有时候有人总是经常说,怎么我的表中没有几条数据,但是还是这么慢呢,这个时候其实奥秘就是这里的高水位线了。

那有没有办法让高水位线下降呢,其实有一种比较简单的方法,那就是采用TRUNCATE语句进行删除数据。采用TRUNCATE语句删除一个表的数据的时候,类似于重新建立了表,不仅把数据都删除了,还把HWM给清空恢复为0。所以如果需要把表清空,在有可能利用TRUNCATE语句来删除数据的时候就利用TRUNCATE语句来删除表,特别是那种数据量有可能很大的临时存储表。

小结:
1)delete语句删除数据,高水位线不会下降。truncate语句清表,高水位线会归为0。
delete from 表名;
truncate table 表名;

2)select语句进行全表扫描时,会扫描高水位线以下的所有数据块。

3)insert into插入数据,会先寻找高水位线以下的空闲块插入,如果没有空闲块就在高水位线上插入,同时高水位线增加。

4)insert /*+append*/ into插入数据时,不寻找是否有空闲块,直接在HWM上插入,同时HWM上升。

参考资料:
http://www.cnblogs.com/linjiqin/archive/2012/01/15/2323030.html
http://blog.csdn.net/dba_waterbin/article/details/8573041