oracle9ir2 nf:压缩表技术-凯发app官方网站

gan's blog

凯发app官方网站首页　| 　博文目录　| 　关于我

g_hk

博客访问： 3976826
博文数量： 536
博客积分： 10470
博客等级：上将
技术积分： 4825
用户组：普通用户
注册时间： 2006-05-26 14:08

文章分类

全部博文（536）

pg（1）
计算机的东西（404）

考试（5）

asm（13）

python（1）

c（17）

vc （1）

sql_pl/sql（29）

ocp（1）

about（2）

assembler（0）

other（18）

数据库（3）

bi（2）

vi（5）

bdb（4）

shell（22）

embed（4）

cpu（2）

socket（3）

makefile（0）

qt（1）

c（26）

gdb（6）

gcc（4）

nfs（4）

aix（4）

block（5）

站内查询（0）

我的源码库（3）

小软件（1）

windows（3）

perl（2）

hp-ux（2）

php（1）

硬件介绍（1）

备份软件（7）

备份知识学习（0）

小点子（2）

linux内核开发（30）

tcp/ip学习（6）

errors（8）

data_dictionary（3）

oracle（50）

linux_c（2）

软件设计（6）

软件开发问题（2）

开发体会（3）

unix/linux（5）

oci（5）

transaction（4）

datatype（15）

开发（17）

linux_c（15）

other（7）

linux_c（18）

pthread（3）
其他（55）

记录（1）

出师（0）

销售（8）

影视（2）

读书（12）

预言（3）

财经（8）

感动（5）
职业规划（11）
学习e文（8）
news（18）
未分配的博文（39）

文章存档

2024年（3）

2021年（1）

2019年（1）

2017年（1）

2016年（2）

2013年（2）

2012年（10）

2011年（43）

2010年（10）

2009年（17）

2008年（121）

2007年（252）

2006年（73）

我的朋友

相关博文

oracle9ir2 nf:压缩表技术

分类： oracle

2011-04-22 13:01:11

从oracle9ir2开始，oracle推出了压缩表技术（table compression），用于压缩数据表中的重复数据，以节省存储空间，压缩技术倾向于在数据仓库中使用。

压缩在数据块级生效，当数据表定义为压缩时，数据库在每个数据块上保留空间存储重复数据的单个拷贝，保留空间被称为符号表（symbol table）。此后在具体行上不必再存储这些重复数据，只需要存放指向符号表相应数据的指针，存储空间因此得以节省。

关于压缩表的基本介绍，参考otn上的文档:

我们看一下简单的测试:

[oracle@jumper oracle]$ sqlplus eygle/eygle

sql*plus: release 9.2.0.4.0 - production on mon jun 26 16:07:24 2006

connected to:
oracle9i enterprise edition release 9.2.0.4.0 - production
with the partitioning option
jserver release 9.2.0.4.0 - production

sql> create table test (c1 varchar2(20),c2 varchar2(20));

table created.

sql> begin
2 for i in 1 .. 10000 loop
3 insert into test values('eygle','test');
4 end loop;
5 end;
6 /

pl/sql procedure successfully completed.

sql> create table test_compress compress as select * from test;

table created.

sql> select table_name,compression from user_tables where table_name like 'test%';

table_name compress
------------------------------ --------
test disabled
test_compress enabled

sql> analyze table test compute statistics;

table analyzed.

sql> analyze table test_compress compute statistics;

table analyzed.

我们看一下两个表的空间使用情况:

sql> select table_name,blocks,empty_blocks from user_tables
2 where table_name like 'test%';

table_name blocks empty_blocks
------------------------------ ---------- ------------
test 28 4
test_compress 18 6

sql> select (28-4)/(18-6) from dual;

(28-4)/(18-6)
-------------
2

我们看到，压缩表只使用了常规表一半的空间。

我们转储一下数据块，看一下压缩表的存储结构：

sql> select segment_name,file_id,block_id,blocks from dba_extents
2 where segment_name='test_compress';

segment_name file_id block_id blocks
-------------------- ---------- ---------- ----------
test_compress 3 17 8
test_compress 3 25 8
test_compress 3 33 8

sql> alter system dump datafile 3 block 20;

system altered.

找到跟踪文件：

sql> @gettrcname.sql

trace_file_name
-------------------------------------------------------------------
/opt/oracle/admin/eygle/udump/eygle_ora_20984.trc

查看内容，首先看一下块头信息:

data_block_dump,data header at 0xaa84e7c
===============
tsiz: 0x1f80
hsiz: 0x5d2
pbl: 0x0aa84e7c
bdba: 0x00c00014
76543210
flag=-0------
ntab=2
nrow=727
frre=-1
fsbo=0x5d2
fseo=0x1144
avsp=0x1a
tosp=0x1a
r0_9ir2=0x0
mec_kdbh9ir2=0x1
r1_9ir2=0x0
76543210
flag_9ir2=-------c
fcls_9ir2[3]={ 0 32768 32768 }
0x1c:pti[0] nrow=1 offs=0
0x20:pti[1] nrow=726 offs=1
0x24:pri[0] offs=0x1f72
0x26:pri[1] offs=0x1f6d

我们看到这个block中的ntab =2 也就是存在2张表，从下面可以找到table 0的信息:

tab 0, row 0, @0x1f72
tl: 14 fb: --h-fl-- lb: 0x0 cc: 2
col 0: [ 5] 65 79 67 6c 65
col 1: [ 4] 74 65 73 74
bindmp: 02 d6 02 cd 65 79 67 6c 65 cc 74 65 73 74

这个table 0只有一条记录，就是我们之前所说的符号表。

此后的记录才是真实数据，每条数据记录包含一个指针，指向符号表：

tab 1, row 0, @0x1f6d
tl: 5 fb: --h-fl-- lb: 0x0 cc: 2
col 0: [ 5] 65 79 67 6c 65
col 1: [ 4] 74 65 73 74
bindmp: 2c 00 01 02 00
tab 1, row 1, @0x1f68
tl: 5 fb: --h-fl-- lb: 0x0 cc: 2
col 0: [ 5] 65 79 67 6c 65
col 1: [ 4] 74 65 73 74
bindmp: 2c 00 01 02 00

这里的bindmp就是指针。

关于压缩表存储结构的进一步探讨可以参考:

biti_rainy 的关于 9ir2 的 compress table 的研究

fuyuncat 的数据段压缩（data segment compression）浅析

压缩表显然是通过cpu换取存储，存储的缩减必然导致存储和查询时压缩和解压缩的cpu消耗。
但是，i/o操作得以节约，我们看一下对以上2个表执行全表扫描的比较：

sql> set autotrace on
sql> select count(*) from test;

count(*)
----------
10000

execution plan
----------------------------------------------------------
0 select statement optimizer=choose (cost=4 card=1)
1 0 sort (aggregate)
2 1 table access (full) of 'test' (cost=4 card=10000)

statistics
----------------------------------------------------------
0 recursive calls
0 db block gets
31 consistent gets
0 physical reads
0 redo size
379 bytes sent via sql*net to client
503 bytes received via sql*net from client
2 sql*net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
1 rows processed

sql> select count(*) from test_compress;
count(*)
----------
10000

execution plan
----------------------------------------------------------
0 select statement optimizer=choose (cost=3 card=1)
1 0 sort (aggregate)
2 1 table access (full) of 'test_compress' (cost=3 card=10000)

statistics
----------------------------------------------------------
0 recursive calls
0 db block gets
17 consistent gets
0 physical reads
0 redo size
379 bytes sent via sql*net to client
503 bytes received via sql*net from client
2 sql*net roundtrips to/from client
0 sorts (memory)
0 sorts (disk)
1 rows processed

压缩表的一致性读只有17，较常规表的31大大减少。

压缩表是为数据仓库设计的特性，所以并不适合oltp系统，在发生更新时，压缩表会因行链接而迅速扩展空间使用。
请看简单测试:

sql> update test_compress set c1='oracle' where rownum <10;

9 rows updated.

sql> commit;

commit complete.

sql> analyze table test_compress compute statistics;

table analyzed.

sql> select table_name,blocks,empty_blocks from user_tables
2 where table_name like 'test%';

table_name blocks empty_blocks
------------------------------ ---------- ------------
test 28 4
test_compress 24 0

具体可以参考wanghai 的文章: compress table

阅读(776) | 评论(0) | 转发(0) |

上一篇：解决unix下@符号报sp2-0734错误

下一篇：c静态存储区测试

给主人留下些什么吧！~~

| | | | |

感谢所有关心和支持过chinaunix的朋友们