亚洲一区二区日本,国产精品综合,国产永久免费高清在线观看

... — Sat, 18 Jun 2011 08:33:00 GMT

��量用鸟语描�q�C��Q�翻译成中文反而容易误解�?br />

一、什么是执行计划

An explain plan is a representation of the access path that is taken when a query is executed within Oracle.

二、如何访问数�?/strong>

At the physical level Oracle reads blocks of data. The smallest amount of data read is a single Oracle block, the largest is constrained by operating system limits (and multiblock i/o). Logically Oracle finds the data to read by using the following methods:
Full Table Scan (FTS)    --全表扫描
Index Lookup (unique & non-unique)    --索引扫描�Q�唯一和非唯一�Q?/span>
Rowid    --物理行id

三、执行计划层�ơ关�p?/strong>

When looking at a plan, the rightmost (ie most inndented) uppermost operation is the first thing that is executed. --采用最��x��上最先执�?/span>的原则看层次关系�Q�在同一�U�如果某个动作没有子ID��最先执�?/span>

1.看一个简单的例子�Q?/span>

Query Plan
-----------------------------------------
SELECT STATEMENT [CHOOSE] Cost=1234
**TABLE ACCESS FULL LARGE [:Q65001] [ANALYZED] --[:Q65001]表示是�ƈ行方式，[ANALYZED]表示该对象已�l�分析过�?/span>

优化模式是CHOOSE的情况下�Q�看Cost参数是否有值来军_��采用CBO�q�是RBO�Q?br />SELECT STATEMENT [CHOOSE] Cost=1234 --Cost有��|��采用CBO
SELECT STATEMENT [CHOOSE] Cost= --Cost为空�Q�采用RBO

2.层次的父子关�p�，看比较复杂的例子�Q?/strong>

PARENT1
**FIRST CHILD
****FIRST GRANDCHILD
**SECOND CHILD

Here the same principles apply, the FIRST GRANDCHILD is the initial operation then the FIRST CHILD followed by the SECOND CHILD and finally the PARENT collates the output.

四、例子解�?/strong>

Execution Plan
----------------------------------------------------------
0 **SELECT STATEMENT Optimizer=CHOOSE (Cost=3 Card=8 Bytes=248)
1 0 **HASH JOIN (Cost=3 Card=8 Bytes=248)
2 1 ****TABLE ACCESS (FULL) OF 'DEPT' (Cost=1 Card=3 Bytes=36)
3 1 ****TABLE ACCESS (FULL) OF 'EMP' (Cost=1 Card=16 Bytes=304)

左侧的两排数据，前面的是序列号ID�Q�后面的是对应的PID�Q�父ID�Q��?br />

A shortened summary of this is:
Execution starts with ID=0: SELECT STATEMENT but this is dependand on it's child objects
So it executes its first child step: ID=1 PID=0 HASH JOIN but this is dependand on it's child objects
So it executes its first child step: ID=2 PID=1 TABLE ACCESS (FULL) OF 'DEPT'
Then the second child step: ID=3 PID=2 TABLE ACCESS (FULL) OF 'EMP'
Rows are returned to the parent step(s) until finished

五、表讉K��方式

1.Full Table Scan (FTS) 全表扫描

In a FTS operation, the whole table is read up to the high water mark (HWM). The HWM marks the last block in the table that has ever had data written to it. If you have deleted all the rows then you will still read up to the HWM. Truncate resets the HWM back to the start of the table. FTS uses multiblock i/o to read the blocks from disk.   --全表扫描模式下会��L��据到表的高水位线�Q�HWM卌��C��曄��扩展的最后一个数据块�Q�，��d��速度依赖于Oracle初始化参�?/span>db_block_multiblock_read_count

Query Plan
------------------------------------
SELECT STATEMENT [CHOOSE] Cost=1
**INDEX UNIQUE SCAN EMP_I1   --如果索引里就扑ֈ�了所要的数据�Q�就不会再去讉K��表了

2.Index Lookup 索引扫描

There are 5 methods of index lookup:

index unique scan   --索引唯一扫描
Method for looking up a single key value via a unique index. always returns a single value, You must supply AT LEAST the leading column of the index to access data via the index.
eg:
SQL> explain plan for select empno,ename from emp where empno=10;

index range scan   --索引局部扫�?/span>
Index range scan is a method for accessing a range values of a particular column. AT LEAST the leading column of the index must be supplied to access data via the index. Can be used for range operations (e.g. > < <> >= <= between) .
eg:
SQL> explain plan for select mgr from emp where mgr = 5;

index full scan   --索引全局扫描
Full index scans are only available in the CBO as otherwise we are unable to determine whether a full scan would be a good idea or not. We choose an index Full Scan when we have statistics that indicate that it is going to be more efficient than a Full table scan and a sort. For example we may do a Full index scan when we do an unbounded scan of an index and want the data to be ordered in the index order.
eg:
SQL> explain plan for select empno,ename from big_emp order by empno,ename;

index fast full scan   --索引快速全局扫描�Q�不带order by情况下常发生
Scans all the block in the index, Rows are not returned in sorted order, Introduced in 7.3 and requires V733_PLANS_ENABLED=TRUE and CBO, may be hinted using INDEX_FFS hint, uses multiblock i/o, can be executed in parallel, can be used to access second column of concatenated indexes. This is because we are selecting all of the index.
eg:
SQL> explain plan for select empno,ename from big_emp;

index skip scan   --索引跌��扫描�Q�where条�g列是非烦引的前导列情况下常发�?br />Index skip scan finds rows even if the column is not the leading column of a concatenated index. It skips the first column(s) during the search.
eg:
SQL> create index i_emp on emp(empno, ename);
SQL> select /*+ index_ss(emp i_emp)*/ job from emp where ename='SMITH';

3.Rowid 物理ID扫描

This is the quickest access method available.Oracle retrieves the specified block and extracts the rows it is interested in. --Rowid扫描是最快的讉K��数据方式

六、表�q�接方式

有三�U�连接方式：

1.Sort Merge Join (SMJ)    --�׃��sort是非常耗资源的�Q�所以这�U�连接方式要避免

Rows are produced by Row Source 1 and are then sorted Rows from Row Source 2 are then produced and sorted by the same sort key as Row Source 1. Row Source 1 and 2 are NOT accessed concurrently.

SQL> explain plan for
select /*+ ordered */ e.deptno,d.deptno
from emp e,dept d
where e.deptno = d.deptno
order by e.deptno,d.deptno;

Query Plan
-------------------------------------
SELECT STATEMENT [CHOOSE] Cost=17
**MERGE JOIN
****SORT JOIN
******TABLE ACCESS FULL EMP [ANALYZED]
****SORT JOIN
******TABLE ACCESS FULL DEPT [ANALYZED]

Sorting is an expensive operation, especially with large tables. Because of this, SMJ is often not a particularly efficient join method.

2.Nested Loops (NL)    --比较高效的一�U�连接方�?/span>

Fetches the first batch of rows from row source 1, Then we probe row source 2 once for each row returned from row source 1.
For nested loops to be efficient it is important that the first row source returns as few rows as possible as this directly controls the number of probes of the second row source. Also it helps if the access method for row source 2 is efficient as this operation is being repeated once for every row returned by row source 1.

SQL> explain plan for
select a.dname,b.sql
from dept a,emp b
where a.deptno = b.deptno;

Query Plan
-------------------------
SELECT STATEMENT [CHOOSE] Cost=5
**NESTED LOOPS
****TABLE ACCESS FULL DEPT [ANALYZED]
****TABLE ACCESS FULL EMP [ANALYZED]

3.Hash Join    --最为高效的一�U�连接方�?/span>

New join type introduced in 7.3, More efficient in theory than NL & SMJ, Only accessible via the CBO. Smallest row source is chosen and used to build a hash table and a bitmap The second row source is hashed and checked against the hash table looking for joins. The bitmap is used as a quick lookup to check if rows are in the hash table and are especially useful when the hash table is too large to fit in memory.

SQL> explain plan for
select /*+ use_hash(emp) */ empno
from emp,dept
where emp.deptno = dept.deptno;

Query Plan
----------------------------
SELECT STATEMENT [CHOOSE] Cost=3
**HASH JOIN
****TABLE ACCESS FULL DEPT
****TABLE ACCESS FULL EMP

Hash joins are enabled by the parameter HASH_JOIN_ENABLED=TRUE in the init.ora or session. TRUE is the default in 7.3.

3.Cartesian Product    --卡��_��积�Q�不��真正的�q�接方式�Q�sql肯定写的有问�?/span>

A Cartesian Product is done where they are no join conditions between 2 row sources and there is no alternative method of accessing the data. Not really a join as such as there is no join! Typically this is caused by a coding mistake where a join has been left out.
It can be useful in some circumstances - Star joins uses cartesian products.Notice that there is no join between the 2 tables:

SQL> explain plan for
select emp.deptno,dept,deptno
from emp,dept

Query Plan
------------------------------
SLECT STATEMENT [CHOOSE] Cost=5
**MERGE JOIN CARTESIAN
****TABLE ACCESS FULL DEPT
****SORT JOIN
******TABLE ACCESS FULL EMP

The CARTESIAN keyword indicate that we are doing a cartesian product.

七、运��符

1.sort    --排序�Q�很消耗资�?/span>

There are a number of different operations that promote sorts:
order by clauses
group by
sort merge join

2.filter    --�q��o�Q�如not in、min函数�{�容易��?br />

Has a number of different meanings, used to indicate partition elimination, may also indicate an actual filter step where one row source is filtering, another, functions such as min may introduce filter steps into query plans.

3.view    --视图�Q�大都由内联视图产生

When a view cannot be merged into the main query you will often see a projection view operation. This indicates that the 'view' will be selected from directly as opposed to being broken down into joins on the base tables. A number of constructs make a view non mergeable. Inline views are also non mergeable.
eg:
SQL> explain plan for
select ename,tot
from emp,(select empno,sum(empno) tot from big_emp group by empno) tmp
where emp.empno = tmp.empno;

Query Plan
------------------------
SELECT STATEMENT [CHOOSE]
**HASH JOIN
**TABLE ACCESS FULL EMP [ANALYZED]
**VIEW
****SORT GROUP BY
******INDEX FULL SCAN BE_IX

4.partition view     --分区视图

Partition views are a legacy technology that were superceded by the partitioning option. This section of the article is provided as reference for such legacy systems.

... 2011-06-18 16:33 发表评论

... — Sat, 18 Jun 2011 08:16:00 GMT

本文介绍了ORACLE执行计划的一些基本概念，供学习应用�?/span>

一�Q�相关的概念

Rowid的概念：rowid是一个伪列，既然是伪列，那么�q�个列就不是用户定义�Q�而是�pȝ��自己�l�加上的�?�Ҏ��个表都有一个rowid的伪列，但是表中�q�不物理存储ROWID列的倹{��不�q�你可以像��用其它列那样使用它，但是不能删除改列�Q�也不能对该列的��D��?修改、插入。一旦一行数据插入数据库�Q�则rowid在该行的生命周期内是唯一的，卛_��使该行��生行�q�移�Q�行的rowid也不会改变�?/span>

Recursive SQL概念�Q�有时�ؓ了执行用户发出的一个sql语句�Q�Oracle必须执行一些额外的语句�Q�我们将�q�些额外的语句称之�ؓ'recursive calls'�?recursive SQL statements'。如当一个DDL语句发出后，ORACLE��L��隐含的发��Z��些recursive SQL语句�Q�来修改数据字典信息�Q�以便用户可以成功的执行该DDL语句。当需要的数据字典信息没有在共享内存中�Ӟ��l�常会发生Recursive calls�Q�这些Recursive calls会将数据字典信息从硬盘读入内存中。用户不比关心这些recursive SQL语句的执行情况，在需要的时候，ORACLE会自动的在内部执行这些语句。当然DML语句与SELECT都可能引起recursive SQL。简单的��_��我们可以��触发器视�ؓrecursive SQL�?/span>

Row Source(行源)�Q�用在查询中�Q�由上一操作�q�回的符合条件的行的集合�Q�即可以是表的全部行数据的集合；也可以是表的部分行数据的集合�Q�也可以为对�?个row source�q�行�q�接操作(如join�q�接)后得到的行数据集合�?/span>

Predicate(谓词)�Q�一个查询中的WHERE限制条�g

Driving Table(驱动�?�Q�该表又�U�Cؓ外层�?OUTER TABLE)。这个概�는�于嵌套与HASH�q�接中。如果该row source�q�回较多的行数据�Q�则�Ҏ��有的后箋操作有负面媄响。注意此处虽然翻译�ؓ驱动表，但实际上��译为驱动行�?driving row source)更�ؓ��切。一般说来，是应用查询的限制条�g后，�q�回较少行源的表作�ؓ驱动表，所以如果一个大表在WHERE条�g有有限制条�g(如等值限 �?�Q�则该大表作为驱动表也是合适的�Q�所以�ƈ不是只有较小的表可以作�ؓ驱动表，正确说法应该为应用查询的限制条�g后，�q�回较少行源的表作�ؓ驱动表。在执行计划中，应该为靠上的那个row source�Q�后面会�l�出具体说明。在我们后面的描�q�C��Q�一般将该表�U�Cؓ�q�接操作的row source 1�?/span>

Probed Table(被探查表)�Q�该表又�U�Cؓ内层�?INNER TABLE)。在我们从驱动表中得到具体一行的数据后，在该表中��L��W�合�q�接条�g的行。所以该表应当�ؓ大表(实际上应该�ؓ�q�回较大row source的表)且相应的列上应该有烦引。在我们后面的描�q�C��Q�一般将该表�U�Cؓ�q�接操作的row source 2�?/span>

�l�合索引(concatenated index)�Q�由多个列构成的索引�Q�如create index idx_emp on emp(col1, col2, col3, ……)�Q�则我们�U�idx_emp索引为组合烦引。在�l�合索引中有一个重要的概念�Q�引导列(leading column)�Q�在上面的例子中�Q�col1列�ؓ引导列。当我们�q�行查询时可以��?#8221;where col1 = ? ”�Q�也可以使用”where col1 = ? and col2 = ?”�Q�这��L��限制条�g都会使用索引�Q�但�?#8221;where col2 = ? ”查询��׃��会��用该索引。所以限制条件中包含先导列时�Q�该限制条�g才会使用该组合烦引�?/span>

可选择�?selectivity)�Q�比较一下列中唯一键的数量和表中的行数�Q�就可以判断该列的可选择性�?如果该列�?#8221;唯一键的数量/表中的行�?#8221;的比��D��接近1�Q�则该列的可选择性越高，该列��p��适合创徏索引�Q�同��L��引的可选择性也��高。在可选择性高的列上进行查询时�Q�返回的数据��p��，比较适合使用索引查询�?/span>

二．oracle讉K��数据的存取方�?/span>

1) 全表扫描�Q�Full Table Scans, FTS�Q?/span>

为实现全表扫描，Oracle��d��表中所有的行，�q�检查每一行是否满��句的WHERE限制条�g一个多块读操作可以使一�ơI/O能读取多块数据块(db_block_multiblock_read_count参数讑֮�)�Q�而不是只��d��一个数据块�Q�这极大的减 ��了I/O��L��敎ͼ�提高了系�l�的吞吐量，所以利用多块读的方法可以十分高效地实现全表扫描�Q�而且只有在全表扫描的情况下才能��用多块读操作。在�q�种讉K��?式下�Q�每个数据块只被��M��ơ�?/span>

使用FTS的前提条�Ӟ��在较大的表上不徏议��用全表扫描，除非取出数据的比较多�Q�超�q�总量�?% -- 10%�Q�或你想使用�q�行查询功能时�?/span>

使用全表扫描的例子：

~~~~~~~~~~~~~~~~~~~~~~~~ SQL> explain plan for select * from dual;

Query Plan

-----------------------------------------

SELECT STATEMENT[CHOOSE] Cost=

TABLE ACCESS FULL DUAL

2) 通过ROWID的表存取�Q�Table Access by ROWID或rowid lookup�Q?/span>

行的ROWID指出了该行所在的数据文�g、数据块以及行在该块中的位置�Q�所以通过ROWID来存取数据可以快速定位到目标数据上，是Oracle存取单行数据的最快方法�?/span>

�q�种存取�Ҏ��不会用到多块��L��作，一�ơI/O只能��d��一个数据块。我们会�l�常在执行计划中看到该存取方法，如通过索引查询数据�?/span>

使用ROWID存取的方法： SQL> explain plan for select * from dept where rowid = 'AAAAyGAADAAAAATAAF';

Query Plan

------------------------------------

SELECT STATEMENT [CHOOSE] Cost=1

TABLE ACCESS BY ROWID DEPT [ANALYZED]

3�Q�烦引扫描（Index Scan或index lookup�Q?/span>

我们先通过index查找到数据对应的rowid�?对于非唯一索引可能�q�回多个rowid�?�Q�然后根据rowid直接从表中得到具体的数据�Q�这 �U�查找方式称为烦引扫描或索引查找(index lookup)。一个rowid唯一的表�C�Z��行数据，该行对应的数据块是通过一�ơi/o得到的，在此情况下该�ơi/o只会��d��一个数据库块�?/span>

在烦引中�Q�除了存储每个烦引的值外�Q�烦引还存储��h��此值的行对应的ROWID倹{��烦引扫描可以由2步组成：(1) 扫描索引得到对应的rowid倹{�?(2) 通过扑ֈ�的rowid从表中读出具体的数据。每步都是单独的一�ơI/O�Q�但是对于烦引，�׃��l�常使用�Q�绝大多数都已经CACHE到内存中�Q�所以第1步的 I/O�l�常是逻辑I/O�Q�即数据可以从内存中得到。但是对于第2步来��_��如果表比较大�Q�则其数据不可能全在内存中，所以其I/O很有可能是物理I/O�Q�这是一个机械操作，相对逻辑I/O来说�Q�是极其�Ҏ��间的。所以如果多大表�q�行索引扫描�Q�取出的数据如果大于总量�?% -- 10%�Q��用烦引扫描会效率下降很多。如下列所�C�：
SQL> explain plan for select empno, ename from emp where empno=10;

Query Plan

------------------------------------

SELECT STATEMENT [CHOOSE] Cost=1

TABLE ACCESS BY ROWID EMP [ANALYZED]

INDEX UNIQUE SCAN EMP_I1

但是如果查询的数据能全在索引中找刎ͼ��可以避免进行第2步操作，避免了不必要的I/O�Q�此时即佉K��过索引扫描取出的数据比较多�Q�效率还是很高的

SQL> explain plan for select empno from emp where empno=10;-- 只查询empno列�?/span>

Query Plan

------------------------------------

SELECT STATEMENT [CHOOSE] Cost=1

INDEX UNIQUE SCAN EMP_I1

�q�一步讲�Q�如果sql语句中对索引列进行排序，因�ؓ索引已经预先排序好了�Q�所以在执行计划中不需要再对烦引列�q�行排序
SQL> explain plan for select empno, ename from emp

where empno > 7876 order by empno;

Query Plan

--------------------------------------------------------------------------------

SELECT STATEMENT[CHOOSE] Cost=1

TABLE ACCESS BY ROWID EMP [ANALYZED]

INDEX RANGE SCAN EMP_I1 [ANALYZED]

从这个例子中可以看到�Q�因为烦引是已经排序了的�Q�所以将按照索引的顺序查询出�W�合条�g的行�Q�因此避免了�q�一步排序操作�?/span>

�Ҏ��索引的类型与where限制条�g的不同，�?�U�类型的索引扫描�Q?/span>

索引唯一扫描(index unique scan)

索引范围扫描(index range scan)

索引全扫�?index full scan)

索引快速扫�?index fast full scan)

(1) 索引唯一扫描(index unique scan)

通过唯一索引查找一个数值经常返回单个ROWID。如果存在UNIQUE 或PRIMARY KEY �U�束�Q�它保证了语句只存取单行�Q�的话，Oracle�l�常实现唯一性扫描�?/span>

使用唯一性约束的例子�Q?/span>

SQL> explain plan for

select empno,ename from emp where empno=10;

Query Plan

------------------------------------

SELECT STATEMENT [CHOOSE] Cost=1

TABLE ACCESS BY ROWID EMP [ANALYZED]

INDEX UNIQUE SCAN EMP_I1

(2) 索引范围扫描(index range scan)

使用一个烦引存取多行数据，在唯一索引上��用烦引范围扫描的典型情况下是在谓�?where限制条�g)中��用了范围操作�W?�?gt;�?lt;�?lt;>�?gt;=�?lt;=、between)

使用索引范围扫描的例子：

SQL> explain plan for select empno,ename from emp

where empno > 7876 order by empno;

Query Plan

--------------------------------------------------------------------------------

SELECT STATEMENT[CHOOSE] Cost=1

TABLE ACCESS BY ROWID EMP [ANALYZED]

INDEX RANGE SCAN EMP_I1 [ANALYZED]

在非唯一索引上，谓词col = 5可能�q�回多行数据�Q�所以在非唯一索引上都使用索引范围扫描�?/span>

使用index rang scan�?�U�情况：

(a) 在唯一索引列上使用了range操作�W?> < <> >= <= between)

(b) 在组合烦引上�Q�只使用部分列进行查询，��D��查询出多�?/span>

(c) 寚w��唯一索引列上�q�行的�Q何查询�?/span>

(3) 索引全扫�?index full scan)

与全表扫描对应，也有相应的全索引扫描。而且此时查询出的数据都必��M��索引中可以直接得到�?/span>

全烦引扫描的例子�Q?/span>

An Index full scan will not perform single block i/o's and so it may prove to be inefficient.

e.g.

Index BE_IX is a concatenated index on big_emp (empno, ename)

SQL> explain plan for select empno, ename from big_emp order by empno,ename;

Query Plan

--------------------------------------------------------------------------------

SELECT STATEMENT[CHOOSE] Cost=26

INDEX FULL SCAN BE_IX [ANALYZED]

(4) 索引快速扫�?index fast full scan)

扫描索引中的所有的数据块，�?index full scan很类��|��但是一个显著的区别��是它不�Ҏ��询出的数据进行排序，��x��据不是以排序��序被返回。在�q�种存取�Ҏ��中，可以使用多块��d��能，也可以��用�ƈ行读入，以便获得最大吞吐量与羃短执行时间�?/span>

索引快速扫描的例子�Q?/span>

BE_IX索引是一个多列烦引： big_emp (empno,ename)

SQL> explain plan for select empno,ename from big_emp;

Query Plan

------------------------------------------

SELECT STATEMENT[CHOOSE] Cost=1

INDEX FAST FULL SCAN BE_IX [ANALYZED]

只选择多列索引的第2列：

SQL> explain plan for select ename from big_emp;

Query Plan

------------------------------------------

SELECT STATEMENT[CHOOSE] Cost=1

INDEX FAST FULL SCAN BE_IX [ANALYZED]

�?表之间的�q�接

Join是一�U�试囑ְ�两个表结合在一��L��谓词�Q�一�ơ只能连�?个表�Q�表�q�接也可以被�U�Cؓ表关联。在后面的叙 �q�C��Q�我们将会��?#8221;row source”来代�?#8221;�?#8221;�Q�因��Z��用row source更严谨一些，�q�且��参与连接的2个row source分别�U�Cؓrow source1和row source 2。Join�q�程的各个步骤经常是串行操作�Q�即使相关的row source可以被�ƈ行访问，卛_��以�ƈ行的��d��做join�q�接的两个row source的数据，但是在将表中�W�合限制条�g的数据读入到内存形成row source后，join的其它步骤一般是串行的。有多种�Ҏ��可以��?个表�q�接��h��Q�当然每�U�方法都有自��q��优缺点，每种�q�接�c�d��只有在特定的条�g下才�?发挥出其最大优�ѝ�?/span>

row source(�?之间的连接顺序对于查询的效率有非常大的媄响。通过首先存取特定的表�Q�即��该表作为驱动表�Q�这样可以先应用某些限制条�g�Q�从而得��C��?较小的row source�Q��ɘq�接的效率较高，�q�也��是我们常说的要先执行限制条件的原因。一般是在将表读入内存时�Q�应用where子句中对该表的限制条件�?/span>

�Ҏ��2个row source的连接条件的中操作符的不同，可以��连接分为等��D��?如WHERE A.COL3 = B.COL4)、非�{��D��?WHERE A.COL3 > B.COL4)、外�q�接(WHERE A.COL3 = B.COL4(+))。上面的各个�q�接的连接原理都基本一��P��所以�ؓ了简单期��_��下面以等��D��接�ؓ例进行介�l��?/span>

在后面的介绍中，都已�Q?/span>

SELECT A.COL1, B.COL2

FROM A, B

WHERE A.COL3 = B.COL4;

��Z��q�行说明�Q�假设A表�ؓRow Soruce1�Q�则其对应的�q�接操作兌��列�ؓCOL 3�Q�B表�ؓRow Soruce2�Q�则其对应的�q�接操作兌��列�ؓCOL 4�Q?/span>

�q�接�c�d��Q?/span>

目前为止�Q�无��接操作符如何�Q�典型的�q�接�c�d��共有3�U�：

排序 - - 合�ƈ�q�接(Sort Merge Join (SMJ) )

嵌套循环(Nested Loops (NL) )

哈希�q�接(Hash Join)

排序 - - 合�ƈ�q�接(Sort Merge Join, SMJ)

内部�q�接�q�程�Q?/span>

1) 首先生成row source1需要的数据�Q�然后对�q�些数据按照�q�接操作兌��?如A.col3)�q�行排序�?/span>

2) 随后生成row source2需要的数据�Q�然后对�q�些数据按照与sort source1对应的连接操作关联列(如B.col4)�q�行排序�?/span>

3) 最后两边已排序的行被放在一��h��行合�q�操作，卛_��2个row source按照�q�接条�g�q�接��h��

下面是连接步骤的囑�Ş表示�Q?/span>

MERGE

/\

SORTSORT

||

Row Source 1Row Source 2

如果row source已经在连接关联列上被排序�Q�则该连接操作就不需要再�q�行sort操作�Q�这样可以大大提高这�U�连接操作的�q�接速度�Q�因为排序是个极其费资源的操作，特别是对于较大的表。预先排序的row source包括已经被烦引的�?如a.col3或b.col4上有索引)或row source已经在前面的步骤中被排序了。尽��合�q�两个row source的过�E�是串行的，但是可以�q�行讉K��q�两个row source(如�ƈ行读入数据，�q�行排序).

SMJ�q�接的例子：
SQL> explain plan for

select /*+ ordered */ e.deptno, d.deptno

from emp e, dept d

where e.deptno = d.deptno

order by e.deptno, d.deptno;

Query Plan

-------------------------------------

SELECT STATEMENT [CHOOSE] Cost=17

MERGE JOIN

SORT JOIN

TABLE ACCESS FULL EMP [ANALYZED]

SORT JOIN

TABLE ACCESS FULL DEPT [ANALYZED]

排序是一个费时、费资源的操作，特别对于大表。基于这个原因，SMJ�l�常不是一个特别有效的�q�接�Ҏ��Q�但是如�?个row source都已�l�预先排序，则这�U�连接方法的效率也是蛮高的�?/span>

嵌套循环(Nested Loops, NL)

�q�个�q�接�Ҏ��有驱动表(外部�?的概��c��其实，该连接过�E�就是一�?层嵌套��@环，所以外层��@环的�ơ数��少��好�Q�这也就是我们�ؓ什么将��表或返回较��?row source的表作�ؓ驱动�?用于外层循环)的理��Z��据。但是这个理论只是一般指导原则，因�ؓ遵��@�q�个理论�q�不能��M��证��语句产生的I/O�ơ数最��。有�?不遵守这个理��Z��据，反而会获得更好的效率。如果��用这�U�方法，军_��使用哪个表作为驱动表很重要。有时如果驱动表选择不正��，��会��D��语句的性能很差、很差�?/span>

内部�q�接�q�程�Q?/span>

Row source1的Row 1 ---------------- Probe ->Row source 2

Row source1的Row 2 ---------------- Probe ->Row source 2

Row source1的Row 3 ---------------- Probe ->Row source 2

…….

Row source1的Row n ---------------- Probe ->Row source 2

从内部连接过�E�来看，需要用row source1中的每一行，��d��配row source2中的所有行�Q�所以此时保持row source1��可能的��与高效的访问row source2(一般通过索引实现)是媄响这个连接效率的关键问题。这只是理论指导原则�Q�目的是使整个连接操作��生最��的物理I/O�ơ数�Q�而且如果遵守�q?个原则，一般也会��ȝ��物理I/O数最��。但是如果不遵从�q�个指导原则�Q�反而能用更��的物理I/O实现�q�接操作�Q�那��管�q�反指导原则吧！因�ؓ最��的物理 I/O�ơ数才是我们应该遵从的真正的指导原则�Q�在后面的具体案例分析中��q��L��例子�?/span>

在上面的�q�接�q�程中，我们�U�Row source1为驱动表或外部表。Row Source2被称��探查表或内部表�?/span>

在NESTED LOOPS�q�接中，Oracle��d��row source1中的每一行，然后在row sourc2中检查是否有匚w��的行�Q�所有被匚w��的行都被攑ֈ��l�果集中�Q�然后处理row source1中的下一行。这个过�E�一直��l�，直到row source1中的所有行都被处理。这是从�q�接操作中可以得到第一个匹配行的最快的�Ҏ��之一�Q�这�U�类型的�q�接可以用在需要快速响应的语句中，以响应速度�?主要目标�?/span>

如果driving row source(外部�?比较��，�q�且在inner row source(内部�?上有唯一索引�Q�或有高选择性非唯一索引�Ӟ��使用�q�种�Ҏ��可以得到较好的效率。NESTED LOOPS有其它连接方法没有的的一个优�Ҏ��Q�可以先�q�回已经�q�接的行�Q�而不必等待所有的�q�接操作处理完才�q�回数据�Q�这可以实现快速的响应旉��?/span>

如果不��用�ƈ行操作，最好的驱动表是那些应用了where 限制条�g后，可以�q�回较少行数据的的表�Q�所以大表也可能�U�Cؓ驱动表，关键看限制条件。对于�ƈ行查询，我们�l�常选择大表作�ؓ驱动表，因�ؓ大表可以充分利用�q?行功能。当�Ӟ��有时�Ҏ��询��用�ƈ行操作�ƈ不一定会比查询不使用�q�行操作效率高，因�ؓ最后可能每个表只有很少的行�W�合限制条�g�Q�而且�q�要看你的硬仉��|�是�?可以支持�q�行(如是否有多个CPU�Q�多个硬盘控制器)�Q�所以要具体问题具体对待�?/span>

NL�q�接的例子：

SQL> explain plan for

select a.dname,b.sql

from dept a,emp b

where a.deptno = b.deptno;

Query Plan

-------------------------

SELECT STATEMENT [CHOOSE] Cost=5

NESTED LOOPS

TABLE ACCESS FULL DEPT [ANALYZED]

TABLE ACCESS FULL EMP [ANALYZED]

哈希�q�接(Hash Join, HJ)

�q�种�q�接是在oracle 7.3以后引入的，从理��Z��来说比NL与SMJ更高效，而且只用在CBO优化器中�?/span>

较小的row source被用来构建hash table与bitmap�Q�第2个row source被用来被hansed�Q��ƈ与第一个row source生成的hash table�q�行匚w��Q�以便进行进一步的�q�接。Bitmap被用来作��Z��U�比较快的查找方法，来检查在hash table中是否有匚w��的行。特别的�Q�当hash table比较大而不能全部容�U�_��内存中时�Q�这�U�查找方法更为有用。这�U�连接方法也有NL�q�接中所谓的驱动表的概念�Q�被构徏为hash table与bitmap的表为驱动表�Q�当被构建的hash table与bitmap能被容纳在内存中�Ӟ��q�种�q�接方式的效率极高�?/span>

HASH�q�接的例子：

SQL> explain plan for

select /*+ use_hash(emp) */ empno

from emp, dept

where emp.deptno = dept.deptno;

Query Plan

----------------------------

SELECT STATEMENT[CHOOSE] Cost=3

HASH JOIN

TABLE ACCESS FULL DEPT

TABLE ACCESS FULL EMP

要��哈希�q�接有效�Q�需要设�|�HASH_JOIN_ENABLED=TRUE�Q�缺省情况下该参��CؓTRUE�Q�另外，不要忘了�q�要讄�� hash_area_size参数�Q�以使哈希连接高效运行，因�ؓ哈希�q�接会在该参数指定大��的内存中运行，�q�小的参��C��使哈希连接的性能比其他连接方式还要低�?/span>

�ȝ��一下，在哪�U�情况下用哪�U�连接方法比较好�Q?/span>

排序 - - 合�ƈ�q�接(Sort Merge Join, SMJ)�Q?/span>

a) 对于非等��D��接，�q�种�q�接方式的效率是比较高的�?/span>

b) 如果在关联的列上都有索引�Q�效果更好�?/span>

c) 对于��?个较大的row source做连接，该连接方法比NL�q�接要好一些�?/span>

d) 但是如果sort merge�q�回的row source�q�大�Q�则又会��D��使用�q�多的rowid在表中查询数据时�Q�数据库性能下降�Q�因��多的I/O�?/span>

嵌套循环(Nested Loops, NL)�Q?/span>

a) 如果driving row source(外部�?比较��，�q�且在inner row source(内部�?上有唯一索引�Q�或有高选择性非唯一索引�Ӟ��使用�q�种�Ҏ��可以得到较好的效率�?/span>

b) NESTED LOOPS有其它连接方法没有的的一个优�Ҏ��Q�可以先�q�回已经�q�接的行�Q�而不必等待所有的�q�接操作处理完才�q�回数据�Q�这可以实现快速的响应旉��?/span>

哈希�q�接(Hash Join, HJ)�Q?/span>

a) �q�种�Ҏ��是在oracle7后来引入的，使用了比较先�q�的�q�接理论�Q�一般来��_��其效率应该好于其�?�U�连接，但是�q�种�q�接只能用在CBO优化器中�Q�而且需要设�|�合适的hash_area_size参数�Q�才能取得较好的性能�?/span>

b) �?个较大的row source之间�q�接时会取得相对较好的效率，在一个row source较小时则能取得更好的效率�?/span>

c) 只能用于�{��D��接中

�W�卡儿乘�U?Cartesian Product)

当两个row source做连接，但是它们之间没有兌��条�g�Ӟ��׃��在两个row source中做�W�卡儿乘�U�，�q�通常��q��写代码疏漏造成(即程序员忘了写关联条�?。笛卡尔乘积是一个表的每一行依�ơ与另一个表中的所有行匚w��。在�Ҏ��?况下我们可以使用�W�卡儿乘�U�，如在星�Ş�q�接中，除此之外�Q�我们要��量使用�W�卡儿乘�U�，否则�Q�自己想�l�果是什么吧�Q?/span>

注意在下面的语句中，�?个表之间没有�q�接�?/span>

SQL> explain plan for

select emp.deptno,dept,deptno

from emp,dept

Query Plan

------------------------

SLECT STATEMENT [CHOOSE] Cost=5

MERGE JOIN CARTESIAN

TABLE ACCESS FULL DEPT

SORT JOIN

TABLE ACCESS FULL EMP

CARTESIAN关键字指��Z��?个表之间做笛卡尔乘积。假如表emp有n行，dept表有m行，�W�卡��乘�U�的�l�果��是得到n * m行结果�?/span>

... 2011-06-18 16:16 发表评论

[转]你是否懂得Oracle UNION ALL

... — Sat, 18 Jun 2011 08:01:00 GMT

Oracle有很多值得学习的地方，�q�里我们主要介绍Oracle UNION ALL�Q�包括介�l?span lang="EN-US">UNION�{�方面。通常情况下，�?span lang="EN-US">UNION替换WHERE子句中的OR��会起到较好的效果。对索引列��?span lang="EN-US">OR��造成全表扫描。注意，以上规则只针对多个烦引列有效。假如有column没有被烦引，查询效率可能会因为您没有选择OR而降低。在下面的例子中�Q?span lang="EN-US">LOC_ID �?span lang="EN-US">REGION上都建有索引�?span lang="EN-US">

高效�Q?span lang="EN-US">
1. SELECT LOC_ID �?/span> LOC_DESC �Q?/span>REGION FROM LOCATION WHERE LOC_ID = 10 UNION SELECT LOC_ID �Q?/span>
LOC_DESC �Q?/span>REGION FROM LOCATION WHERE REGION = “MELBOURNE”

低效:
1. SELECT LOC_ID �Q?/span>LOC_DESC �Q?/span>REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE”

�?span lang="EN-US">IN来替�?span lang="EN-US">OR�Q?/span>

�q�是一条简单易记的规则�Q�但是实际的执行效果�q�须��验，�?span lang="EN-US">Oracle8i下，两者的执行路径��g��是相同的:

低效:
1. SELECT…. FROM LOCATION WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30

高效�Q?span lang="EN-US">
1. SELECT… FROM LOCATION WHERE LOC_IN IN (10,20,30);

避免在烦引列上��?span lang="EN-US">IS NULL�?span lang="EN-US">IS NOT NULL�Q?/span>

避免在烦引中使用��M��能够为空的列�Q?span lang="EN-US">Oracle��无法��用该索引。对于单列烦引，假如列包含空��|��索引中将不存在此记录。对于复合烦引，假如每个列都为空�Q�烦引中同样不存在此记录。假如至��有一个列不�ؓ�I�，则记录存在于索引中。�D例：假如唯一性烦引徏立在表的A列和B列上�Q��ƈ且表中存在一条记录的 A�Q?span lang="EN-US">B��gؓ(123�Q?span lang="EN-US">null)�Q?span lang="EN-US"> Oracle��不接受下一条具备相�?span lang="EN-US">A�Q?span lang="EN-US">B��|��123,null�Q�的记录(插入)。然而假如�Q何的索引列都为空�Q?span lang="EN-US">Oracle��认为整个键��gؓ�I��空不等于空。因此您能够插入1000 条具备相同键值的记录,当然他们都是�I?span lang="EN-US">! 因�ؓ�I��g��存在于烦引列�?span lang="EN-US">,所�?span lang="EN-US">WHERE子句中对索引列进行空值比较将�?span lang="EN-US">ORACLE停用该烦引�?span lang="EN-US">

��L��使用索引的第一个列�Q?/span>

假如索引是徏立在多个列上�Q�只有在他的�W�一个列(leading column)�?span lang="EN-US">where子句引用�Ӟ��优化器才会选择使用该烦引。这也是一条简单而重要的规则�Q�当仅引用烦引的�W�二个列�Ӟ��优化器��用了全表扫描而忽略了索引�?span lang="EN-US">

�?span lang="EN-US">Oracle UNION ALL替换UNION ( 假如有可能的�?span lang="EN-US">)�Q?/span>

�?span lang="EN-US">SQL语句需�?span lang="EN-US">UNION两个查询�l�果集合�Ӟ��q�两个结果集合会�?span lang="EN-US">Oracle UNION ALL的方式被合�ƈ�Q�然后在输出最�l�结果前�q�行排序。假如用 Oracle UNION ALL替代UNION�Q�这��h��序就不是必要了。效率就会因此得到提高。需要注意的是，Oracle UNION ALL��重复输��Z��个结果集合中相同记录。因此各位还是要从业务需求分析��?span lang="EN-US">Oracle UNION ALL的可行性�?span lang="EN-US"> UNION ��对�l�果集合排序,�q�个操作会��用到SORT_AREA_SIZE�q�块内存。对于这块内存的优化也是相当重要的�?span lang="EN-US">

... 2011-06-18 16:01 发表评论