隨筆-86 評論-33 文章-0 trackbacks-0

        在大型的企業應用或企業級的數據庫應用中，要處理的數據量通常可以達到幾十到幾百GB，有的甚至可以到TB級。雖然存儲介質和數據處理技術的發展也很快，但是仍然不能滿足用戶的需求，為了使用戶的大量的數據在讀寫操作和查詢中速度更快，Oracle提供了對表和索引進行分區的技術，以改善大型應用系統的性能。

使用分區的優點：
    1、增強可用性：如果表的某個分區出現故障，表在其他分區的數據仍然可用；
    2、維護方便：如果表的某個分區出現故障，需要修復數據，只修復該分區即可；
    3、均衡I/O：可以把不同的分區映射到磁盤以平衡I/O，改善整個系統性能；
    4、改善查詢性能：對分區對象的查詢可以僅搜索自己關心的分區，提高檢索速度。

    Oracle數據庫提供對表或索引的分區方法有三種：
        1、范圍分區
        2、Hash分區（散列分區）
        3、復合分區

    下面將以實例的方式分別對這三種分區方法來說明分區表的使用。為了測試方便，我們先建三個表空間。
create tablespace dinya_space01
datafile '/test/demo/oracle/demodata/dinya01.dnf' size 50M

create tablespace dinya_space01
datafile '/test/demo/oracle/demodata/dinya02.dnf' size 50M

create tablespace dinya_space01
datafile '/test/demo/oracle/demodata/dinya03.dnf' size 50M

1  分區表的創建：1.1     范圍分區
    范圍分區就是對數據表中的某個值的范圍進行分區，根據某個值的范圍，決定將該數據存儲在哪個分區上。如根據序號分區，根據業務記錄的創建日期進行分區等。

    需求描述：有一個物料交易表，表名：material_transactions。該表將來可能有千萬級的數據記錄數。要求在建該表的時候使用分區表。這時候我們可以使用序號分區三個區，每個區中預計存儲三千萬的數據，也可以使用日期分區，如每五年的數據存儲在一個分區上。

根據交易記錄的序號分區建表：
SQL> create table dinya_test
2 (
3      transaction_id number primary key,
4      item_id number(8) not null,
5      item_description varchar2(300),
6      transaction_date date not null
7 )
8 partition by range (transaction_id)
9 (
10      partition part_01 values less than(30000000) tablespace dinya_space01,
11      partition part_02 values less than(60000000) tablespace dinya_space02,
12      partition part_03 values less than(maxvalue) tablespace dinya_space03
13 );

Table created.

SQL>

建表成功，根據交易的序號，交易ID在三千萬以下的記錄將存儲在第一個表空間dinya_space01中，分區名為:par_01，在三千萬到六千萬之間的記錄存儲在第二個表空間：dinya_space02中，分區名為：par_02，而交易ID在六千萬以上的記錄存儲在第三個表空間dinya_space03中，分區名為par_03.

根據交易日期分區建表：
SQL> create table dinya_test
2 (
3      transaction_id number primary key,
  4      item_id number(8) not null,
5      item_description varchar2(300),
6      transaction_date date not null
7 )
8 partition by range (transaction_date)
9 (
10 partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')) tablespace dinya_space01,
11 partition part_02 values less than(to_date('2010-01-01','yyyy-mm-dd')) tablespace dinya_space02,
12 partition part_03 values less than(maxvalue) tablespace dinya_space03
13 );

Table created.

SQL>

這樣我們就分別建了以交易序號和交易日期來分區的分區表。每次插入數據的時候，系統將根據指定的字段的值來自動將記錄存儲到制定的分區（表空間）中。

    當然，我們還可以根據需求，使用兩個字段的范圍分布來分區，如partition by range ( transaction_id ,transaction_date),分區條件中的值也做相應的改變，請讀者自行測試。

1.2   Hash分區（散列分區）
    散列分區為通過指定分區編號來均勻分布數據的一種分區類型，因為通過在I/O設備上進行散列分區，使得這些分區大小一致。如將物料交易表的數據根據交易ID散列地存放在指定的三個表空間中：
SQL> create table dinya_test
2 (
3      transaction_id number primary key,
4      item_id number(8) not null,
5      item_description varchar2(300),
6      transaction_date date
7 )
8 partition by hash(transaction_id)
9 (
10      partition part_01 tablespace dinya_space01,
11      partition part_02 tablespace dinya_space02,
12      partition part_03 tablespace dinya_space03
13 );

Table created.

SQL>

    建表成功，此時插入數據，系統將按transaction_id將記錄散列地插入三個分區中，這里也就是三個不同的表空間中。

1.3    復合分區
    有時候我們需要根據范圍分區后，每個分區內的數據再散列地分布在幾個表空間中，這樣我們就要使用復合分區。復合分區是先使用范圍分區，然后在每個分區內再使用散列分區的一種分區方法，如將物料交易的記錄按時間分區，然后每個分區中的數據分三個子分區，將數據散列地存儲在三個指定的表空間中：
SQL> create table dinya_test
2 (
3      transaction_id number primary key,
4      item_id number(8) not null,
5      item_description varchar2(300),
6      transaction_date date
7 )
8 partition by range(transaction_date)subpartition by hash(transaction_id)
9      subpartitions 3 store in (dinya_space01,dinya_space02,dinya_space03)
10 (
11      partition part_01 values less than(to_date('2006-01-01','yyyy-mm-dd')),
12      partition part_02 values less than(to_date('2010-01-01','yyyy-mm-dd')),
13      partition part_03 values less than(maxvalue)
14 );

Table created.

SQL>

    該例中，先是根據交易日期進行范圍分區，然后根據交易的ID將記錄散列地存儲在三個表空間中。

2    分區表操作
以上了解了三種分區表的建表方法，下面將使用實際的數據并針對按日期的范圍分區來測試分區表的數據記錄的操作。
2.1     插入記錄：
SQL> insert into dinya_test values(1,12,'BOOKS',sysdate);
1 row created.
SQL> insert into dinya_test values(2,12, 'BOOKS',sysdate+30);
1 row created.
SQL> insert into dinya_test values(3,12, 'BOOKS',to_date('2006-05-30','yyyy-mm-dd'));
1 row created.
SQL> insert into dinya_test values(4,12, 'BOOKS',to_date('2007-06-23','yyyy-mm-dd'));
1 row created.
SQL> insert into dinya_test values(5,12, 'BOOKS',to_date('2011-02-26','yyyy-mm-dd'));
1 row created.
SQL> insert into dinya_test values(6,12, 'BOOKS',to_date('2011-04-30','yyyy-mm-dd'));
1 row created.
SQL> commit;
Commit complete.
SQL>
    按上面的建表結果，2006年前的數據將存儲在第一個分區part_01上，而2006年到2010年的交易數據將存儲在第二個分區part_02上，2010年以后的記錄存儲在第三個分區part_03上。
2.2     查詢分區表記錄：
SQL> select * from dinya_test partition(part_01);
TRANSACTION_ID    ITEM_ID       ITEM_DESCRIPTION            TRANSACTION_DATE
--------------------------------------------------------------------------------
             1     12            BOOKS                      2005-1-14 14:19:
             2     12            BOOKS                      2005-2-13 14:19:
SQL>

SQL> select * from dinya_test partition(part_02);
TRANSACTION_ID     ITEM_ID      ITEM_DESCRIPTION            TRANSACTION_DATE
--------------------------------------------------------------------------------
             3      12            BOOKS                       2006-5-30
             4      12            BOOKS                       2007-6-23
SQL>

SQL> select * from dinya_test partition(part_03);
TRANSACTION_ID     ITEM_ID         ITEM_DESCRIPTION      TRANSACTION_DATE
--------------------------------------------------------------------------------
             5      12               BOOKS                 2011-2-26
             6      12               BOOKS                 2011-4-30
SQL>

    從查詢的結果可以看出，插入的數據已經根據交易時間范圍存儲在不同的分區中。這里是指定了分區的查詢，當然也可以不指定分區，直接執行select * from dinya_test查詢全部記錄。在也檢索的數據量很大的時候，指定分區會大大提高檢索速度。

2.3     更新分區表的記錄：
SQL> update dinya_test partition(part_01) t set t.item_description='DESK' where t.transaction_id=1;
1 row updated.

SQL> commit;
Commit complete.
SQL>

    這里將第一個分區中的交易ID=1的記錄中的item_description字段更新為“DESK”，可以看到已經成功更新了一條記錄。但是當更新的時候指定了分區，而根據查詢的記錄不在該分區中時，將不會更新數據，請看下面的例子：

SQL> update dinya_test partition(part_01) t set t.item_description='DESK' where t.transaction_id=6;

0 rows updated.

SQL> commit;

Commit complete.

SQL>

指定了在第一個分區中更新記錄，但是條件中限制交易ID為6，而查詢全表，交易ID為6的記錄在第三個分區中，這樣該條語句將不會更新記錄。

2.4     刪除分區表記錄：
SQL> delete from dinya_test partition(part_02) t where t.transaction_id=4;
1 row deleted.

SQL> commit;
Commit complete.

SQL>

上面例子刪除了第二個分區part_02中的交易記錄ID為4的一條記錄，和更新數據相同，如果指定了分區，而條件中的數據又不在該分區中時，將不會刪除任何數據。

3     分區表索引的使用：
分區表和一般表一樣可以建立索引，分區表可以創建局部索引和全局索引。當分區中出現許多事務并且要保證所有分區中的數據記錄的唯一性時采用全局索引。
3.1     局部索引分區的建立：
SQL> create index dinya_idx_t on dinya_test(item_id)
2 local
3 (
4     partition idx_1 tablespace dinya_space01,
5     partition idx_2 tablespace dinya_space02,
6     partition idx_3 tablespace dinya_space03
7 );

Index created.

看查詢的執行計劃，從下面的執行計劃可以看出，系統已經使用了索引：
SQL> select * from dinya_test partition(part_01) t where t.item_id=12;
Execution Plan
----------------------------------------------------------
   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=1 Bytes=187)
   1    0   TABLE ACCESS (BY LOCAL INDEX ROWID) OF 'DINYA_TEST' (Cost=2 Card=1 Bytes=187)
   2    1     INDEX (RANGE SCAN) OF 'DINYA_IDX_T' (NON-UNIQUE) (Cost=1 Card=1)

Statistics
----------------------------------------------------------
          0 recursive calls
          0 db block gets
          4 consistent gets
          0 physical reads
          0 redo size
        334 bytes sent via SQL*Net to client
        309 bytes received via SQL*Net from client
          2 SQL*Net roundtrips to/from client
          1 sorts (memory)
          0 sorts (disk)
          2 rows processed

SQL>

3.2     全局索引分區的建立。
全局索引建立時global 子句允許指定索引的范圍值，這個范圍值為索引字段的范圍值：
SQL> create index dinya_idx_t on dinya_test(item_id)
2 global partition by range(item_id)
3 (
4     partition idx_1 values less than (1000) tablespace dinya_space01,
5    partition idx_2 values less than (10000) tablespace dinya_space02,
6     partition idx_3 values less than (maxvalue) tablespace dinya_space03
7 );

Index created.

SQL>

    本例中對表的item_id字段建立索引分區，當然也可以不指定索引分區名直接對整個表建立索引，如：
SQL> create index dinya_idx_t on dinya_test(item_id);
Index created.

SQL>

    同樣的，對全局索引根據執行計劃可以看出索引已經可以使用：
SQL> select * from dinya_test t where t.item_id=12;
Execution Plan
----------------------------------------------------------
   0      SELECT STATEMENT Optimizer=CHOOSE (Cost=2 Card=3 Bytes=561)
   1    0   TABLE ACCESS (BY GLOBAL INDEX ROWID) OF 'DINYA_TEST' (Cost =2 Card=3 Bytes=561)
   2    1     INDEX (RANGE SCAN) OF 'DINYA_IDX_T' (NON-UNIQUE) (Cost=1 Card=3)

Statistics
----------------------------------------------------------
          5 recursive calls
          0 db block gets
         10 consistent gets
          0 physical reads
          0 redo size
        420 bytes sent via SQL*Net to client
        309 bytes received via SQL*Net from client
          2 SQL*Net roundtrips to/from client
          3 sorts (memory)
          0 sorts (disk)
          5 rows processed
SQL>

4     分區表的維護：
    了解了分區表的建立、索引的建立、表和索引的使用后，在應用的還要經常對分區進行維護和管理。日常維護和管理的內容包括：增加一個分區，合并一個分區及刪除分區等等。下面以范圍分區為例說明增加、合并、刪除分區的一般操作：
4.1     增加一個分區:
SQL> alter table dinya_test
2 add partition part_04 values less than(to_date('2012-01-01','yyyy-mm-dd')) tablespace dinya_space03;

Table altered.

SQL>

    增加一個分區的時候，增加的分區的條件必須大于現有分區的最大值，否則系統將提示ORA-14074 partition bound must collate higher than that of the last partition 錯誤。


4.2     合并一個分區：
SQL> alter table dinya_test merge partitions part_01,part_02 into partition part_02;

Table altered.

SQL>

    在本例中將原有的表的part_01分區和part_02分區進行了合并，合并后的分區為part_02,如果在合并的時候把合并后的分區定為part_01的時候，系統將提示ORA-14275 cannot reuse lower-bound partition as resulting partition 錯誤。

4.3     刪除分區：
SQL> alter table dinya_test drop partition part_01;

Table altered.

SQL>

    刪除分區表的一個分區后，查詢該表的數據時顯示，該分區中的數據已全部丟失，所以執行刪除分區動作時要慎重，確保先備份數據后再執行，或將分區合并。

5    總結：
    需要說明的是，本文在舉例說名分區表事務操作的時候，都指定了分區，因為指定了分區，系統在執行的時候則只操作該分區的記錄，提高了數據處理的速度。不要指定分區直接操作數據也是可以的。在分區表上建索引及多索引的使用和非分區表一樣。此外，因為在維護分區的時候可能對分區的索引會產生一定的影響，可能需要在維護之后重建索引，相關內容請參考分區表索引部分的文檔。

posted on 2008-06-16 09:27 Derek.Guo 閱讀(1853) 評論(0) 編輯收藏所屬分類: Database

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: mysql常用的hint Mysql innodb引擎優化 Oracle 10g Recycle Bin Oracle中分區表的使用 ORACLE CTXCAT-CATSEARCH ORACLE JOBS Oracle 分區表(Partition) 數據庫性能常用SQL SQL SERVER事務處理

<

2008年6月

>

日

一

二

三

四

五

六

25

26

27

28

29

30

31

1

2

3

4

5

6

7

8

9

10

11

12

13

14

15

16

17

18

19

20

21

22

23

24

25

26

27

28

29

30

1

2

3

4

5

留言簿(7)

隨筆分類(83)

文章分類

Mongodb

技術網站

54chen
Coreseek中文全文檢索
Dominic-Blog
GFlot
GWT charting library http://repository.jboss.org/maven2/ca/nanometrics/gflot/1.0.0/
GWT Showcase
JavaCC、解析樹和 XQuery 語法
Mongodb手冊
MySQL 5.1參考手冊
Mysql部落
Nginx 的中文維基
Redis
Sphinxsearch
spymemcached
A simple, asynchronous, single-threaded memcached client written in java.
Spymemcached
Tigase
輕量高性能JABBER/XMPP服務器，帶GWT開發的客戶端
Tomcat 系統架構與設計模式
xmemcached
Extreme performance modern memcached client for java
播布客
百度文庫瀏覽器分析及實現
紅聯Linux

積分與排名

積分 - 189397
排名 - 306

留言簿(7)

隨筆分類(83)

文章分類

技術網站

積分與排名

最新隨筆

最新評論

閱讀排行榜