??xml version="1.0" encoding="utf-8" standalone="yes"?> 量用鸟语描qCQ翻译成中文反而容易误解?br /> An explain plan is a representation of the access path that is taken when a query is executed within Oracle. At the physical level Oracle reads blocks of data. The smallest amount of data read is a single Oracle block, the largest is constrained by operating system limits (and multiblock i/o). Logically Oracle finds the data to read by using the following methods: When looking at a plan, the rightmost (ie most inndented) uppermost operation is the first thing that is executed. --采用最x上最先执?/span>的原则看层次关系Q在同一U如果某个动作没有子ID最先执?/span> 1.看一个简单的例子Q?/span> Query Plan 优化模式是CHOOSE的情况下Q看Cost参数是否有值来军_采用CBOq是RBOQ?br />SELECT STATEMENT [CHOOSE] Cost=1234 --Cost有|采用CBO 2.层次的父子关p,看比较复杂的例子Q?/strong> Here the same principles apply, the FIRST GRANDCHILD is the initial operation then the FIRST CHILD followed by the SECOND CHILD and finally the PARENT collates the output. Execution Plan 左侧的两排数据,前面的是序列号IDQ后面的是对应的PIDQ父IDQ?br /> A shortened summary of this is: 1.Full Table Scan (FTS) 全表扫描 In a FTS operation, the whole table is read up to the high water mark (HWM). The HWM marks the last block in the table that has ever had data written to it. If you have deleted all the rows then you will still read up to the HWM. Truncate resets the HWM back to the start of the table. FTS uses multiblock i/o to read the blocks from disk. --全表扫描模式下会L据到表的高水位线QHWM卌C曄扩展的最后一个数据块Q,d速度依赖于Oracle初始化参?/span>db_block_multiblock_read_count Query Plan 2.Index Lookup 索引扫描 There are 5 methods of index lookup: index unique scan --索引唯一扫描 index full scan --索引全局扫描 index fast full scan --索引快速全局扫描Q不带order by情况下常发生 3.Rowid 物理ID扫描 This is the quickest access method available.Oracle retrieves the specified block and extracts the rows it is interested in. --Rowid扫描是最快的讉K数据方式 有三U连接方式: 1.Sort Merge Join (SMJ) --׃sort是非常耗资源的Q所以这U连接方式要避免 Rows are produced by Row Source 1 and are then sorted Rows from Row Source 2 are then produced and sorted by the same sort key as Row Source 1. Row Source 1 and 2 are NOT accessed concurrently. SQL> explain plan for
Sorting is an expensive operation, especially with large tables. Because of this, SMJ is often not a particularly efficient join method. 2.Nested Loops (NL) --比较高效的一U连接方?/span> Fetches the first batch of rows from row source 1, Then we probe row source 2 once for each row returned from row source 1. SQL> explain plan for
Query Plan 3.Hash Join --最为高效的一U连接方?/span> New join type introduced in 7.3, More efficient in theory than NL & SMJ, Only accessible via the CBO. Smallest row source is chosen and used to build a hash table and a bitmap The second row source is hashed and checked against the hash table looking for joins. The bitmap is used as a quick lookup to check if rows are in the hash table and are especially useful when the hash table is too large to fit in memory.
SQL> explain plan for
Query Plan
Hash joins are enabled by the parameter HASH_JOIN_ENABLED=TRUE in the init.ora or session. TRUE is the default in 7.3. 3.Cartesian Product --卡_积Q不真正的q接方式Qsql肯定写的有问?/span> A Cartesian Product is done where they are no join conditions between 2 row sources and there is no alternative method of accessing the data. Not really a join as such as there is no join! Typically this is caused by a coding mistake where a join has been left out.
SQL> explain plan for
Query Plan
The CARTESIAN keyword indicate that we are doing a cartesian product. 七、运符 1.sort --排序Q很消耗资?/span> There are a number of different operations that promote sorts: 2.filter --qoQ如not in、min函数{容易?br /> Has a number of different meanings, used to indicate partition elimination, may also indicate an actual filter step where one row source is filtering, another, functions such as min may introduce filter steps into query plans. 3.view --视图Q大都由内联视图产生 When a view cannot be merged into the main query you will often see a projection view operation. This indicates that the 'view' will be selected from directly as opposed to being broken down into joins on the base tables. A number of constructs make a view non mergeable. Inline views are also non mergeable.
Query Plan 4.partition view --分区视图
Partition views are a legacy technology that were superceded by the partitioning option. This section of the article is provided as reference for such legacy systems. 本文介绍了ORACLE执行计划的一些基本概念,供学习应用?/span> 一Q相关的概念 Rowid的概念:rowid是一个伪列,既然是伪列,那么q个列就不是用户定义Q而是pȝ自己l加上的?Ҏ个表都有一个rowid的伪列,但是表中q不物理存储ROWID列的倹{不q你可以像用其它列那样使用它,但是不能删除改列Q也不能对该列的D?修改、插入。一旦一行数据插入数据库Q则rowid在该行的生命周期内是唯一的,卛_使该行生行q移Q行的rowid也不会改变?/span> Recursive SQL概念Q有时ؓ了执行用户发出的一个sql语句QOracle必须执行一些额外的语句Q我们将q些额外的语句称之ؓ'recursive calls'?recursive SQL statements'。如当一个DDL语句发出后,ORACLEL隐含的发Z些recursive SQL语句Q来修改数据字典信息Q以便用户可以成功的执行该DDL语句。当需要的数据字典信息没有在共享内存中Ӟl常会发生Recursive callsQ这些Recursive calls会将数据字典信息从硬盘读入内存中。用户不比关心这些recursive SQL语句的执行情况,在需要的时候,ORACLE会自动的在内部执行这些语句。当然DML语句与SELECT都可能引起recursive SQL。简单的_我们可以触发器视ؓrecursive SQL?/span> Row Source(行源)Q用在查询中Q由上一操作q回的符合条件的行的集合Q即可以是表的全部行数据的集合;也可以是表的部分行数据的集合Q也可以为对?个row sourceq行q接操作(如joinq接)后得到的行数据集合?/span> Predicate(谓词)Q一个查询中的WHERE限制条g Driving Table(驱动?Q该表又UCؓ外层?OUTER TABLE)。这个概는于嵌套与HASHq接中。如果该row sourceq回较多的行数据Q则Ҏ有的后箋操作有负面媄响。注意此处虽然翻译ؓ驱动表,但实际上译为驱动行?driving row source)更ؓ切。一般说来,是应用查询的限制条g后,q回较少行源的表作ؓ驱动表,所以如果一个大表在WHERE条g有有限制条g(如等值限 ?Q则该大表作为驱动表也是合适的Q所以ƈ不是只有较小的表可以作ؓ驱动表,正确说法应该为应用查询的限制条g后,q回较少行源的表作ؓ驱动表。在执行 计划中,应该为靠上的那个row sourceQ后面会l出具体说明。在我们后面的描qCQ一般将该表UCؓq接操作的row source 1?/span> Probed Table(被探查表)Q该表又UCؓ内层?INNER TABLE)。在我们从驱动表中得到具体一行的数据后,在该表中LW合q接条g的行。所以该表应当ؓ大表(实际上应该ؓq回较大row source的表)且相应的列上应该有烦引。在我们后面的描qCQ一般将该表UCؓq接操作的row source 2?/span> l合索引(concatenated index)Q由多个列构成的索引Q如create index idx_emp on emp(col1, col2, col3, ……)Q则我们Uidx_emp索引为组合烦引。在l合索引中有一个重要的概念Q引导列(leading column)Q在上面的例子中Qcol1列ؓ引导列。当我们q行查询时可以?#8221;where col1 = ? ”Q也可以使用”where col1 = ? and col2 = ?”Q这L限制条g都会使用索引Q但?#8221;where col2 = ? ”查询׃会用该索引。所以限制条件中包含先导列时Q该限制条g才会使用该组合烦引?/span> 可选择?selectivity)Q比较一下列中唯一键的数量和表中的行数Q就可以判断该列的可选择性?如果该列?#8221;唯一键的数量/表中的行?#8221;的比D接近1Q则该列的可选择性越高,该列p适合创徏索引Q同L引的可选择性也高。在可选择性高的列上进 行查询时Q返回的数据p,比较适合使用索引查询?/span> 二.oracle讉K数据的存取方?/span> 1) 全表扫描QFull Table Scans, FTSQ?/span> 为实现全表扫描,Oracled表中所有的行,q检查每一行是否满句的WHERE限制条g一个多块读 操作可以使一ơI/O能读取多块数据块(db_block_multiblock_read_count参数讑֮)Q而不是只d一个数据块Q这极大的减 了I/OL敎ͼ提高了系l的吞吐量,所以利用多块读的方法可以十分高效地实现全表扫描Q而且只有在全表扫描的情况下才能用多块读操作。在q种讉K?式下Q每个数据块只被Mơ?/span> 使用FTS的前提条Ӟ在较大的表上不徏议用全表扫描,除非取出数据的比较多Q超q总量?% -- 10%Q或你想使用q行查询功能时?/span> 使用全表扫描的例子: ~~~~~~~~~~~~~~~~~~~~~~~~ SQL> explain plan for select * from dual; Query Plan ----------------------------------------- SELECT STATEMENT[CHOOSE] Cost= TABLE ACCESS FULL DUAL 2) 通过ROWID的表存取QTable Access by ROWID或rowid lookupQ?/span> 行的ROWID指出了该行所在的数据文g、数据块以及行在该块中的位置Q所以通过ROWID来存取数据可以快速定位到目标数据上,是Oracle存取单行数据的最快方法?/span> q种存取Ҏ不会用到多块L作,一ơI/O只能d一个数据块。我们会l常在执行计划中看到该存取方法,如通过索引查询数据?/span> 使用ROWID存取的方法: SQL> explain plan for select * from dept where rowid = 'AAAAyGAADAAAAATAAF'; Query Plan ------------------------------------ SELECT STATEMENT [CHOOSE] Cost=1 TABLE ACCESS BY ROWID DEPT [ANALYZED]
我们先通过index查找到数据对应的rowid?对于非唯一索引可能q回多个rowid?Q然后根据rowid直接从表中得到具体的数据Q这 U查找方式称为烦引扫描或索引查找(index lookup)。一个rowid唯一的表CZ行数据,该行对应的数据块是通过一ơi/o得到的,在此情况下该ơi/o只会d一个数据库块?/span> 在烦引中Q除了存储每个烦引的值外Q烦引还存储h此值的行对应的ROWID倹{烦引扫描可以由2步组成:(1) 扫描索引得到对应的rowid倹{?(2) 通过扑ֈ的rowid从表中读出具体的数据。每步都是单独的一ơI/OQ但是对于烦引,׃l常使用Q绝大多数都已经CACHE到内存中Q所以第1步的 I/Ol常是逻辑I/OQ即数据可以从内存中得到。但是对于第2步来_如果表比较大Q则其数据不可能全在内存中,所以其I/O很有可能是物理I/OQ这 是一个机械操作,相对逻辑I/O来说Q是极其Ҏ间的。所以如果多大表q行索引扫描Q取出的数据如果大于总量?% -- 10%Q用烦引扫描会效率下降很多。如下列所C: Query Plan ------------------------------------ SELECT STATEMENT [CHOOSE] Cost=1 TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX UNIQUE SCAN EMP_I1 SQL> explain plan for select empno from emp where empno=10;-- 只查询empno列?/span> Query Plan ------------------------------------ SELECT STATEMENT [CHOOSE] Cost=1 INDEX UNIQUE SCAN EMP_I1 q一步讲Q如果sql语句中对索引列进行排序,因ؓ索引已经预先排序好了Q所以在执行计划中不需要再对烦引列q行排序 where empno > 7876 order by empno; Query Plan -------------------------------------------------------------------------------- SELECT STATEMENT[CHOOSE] Cost=1 TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX RANGE SCAN EMP_I1 [ANALYZED] Ҏ索引的类型与where限制条g的不同,?U类型的索引扫描Q?/span> 索引唯一扫描(index unique scan) 索引范围扫描(index range scan) 索引全扫?index full scan) 索引快速扫?index fast full scan) (1) 索引唯一扫描(index unique scan) 通过唯一索引查找一个数值经常返回单个ROWID。如果存在UNIQUE 或PRIMARY KEY U束Q它保证了语句只存取单行Q的话,Oraclel常实现唯一性扫描?/span> 使用唯一性约束的例子Q?/span> SQL> explain plan for select empno,ename from emp where empno=10; Query Plan ------------------------------------ SELECT STATEMENT [CHOOSE] Cost=1 TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX UNIQUE SCAN EMP_I1 (2) 索引范围扫描(index range scan) 使用一个烦引存取多行数据,在唯一索引上用烦引范围扫描的典型情况下是在谓?where限制条g)中用了范围操作W??gt;?lt;?lt;>?gt;=?lt;=、between) 使用索引范围扫描的例子: where empno > 7876 order by empno; Query Plan -------------------------------------------------------------------------------- SELECT STATEMENT[CHOOSE] Cost=1 TABLE ACCESS BY ROWID EMP [ANALYZED] INDEX RANGE SCAN EMP_I1 [ANALYZED] 在非唯一索引上,谓词col = 5可能q回多行数据Q所以在非唯一索引上都使用索引范围扫描?/span> 使用index rang scan?U情况: (a) 在唯一索引列上使用了range操作W?> < <> >= <= between) (b) 在组合烦引上Q只使用部分列进行查询,D查询出多?/span> (c) 寚w唯一索引列上q行的Q何查询?/span> (3) 索引全扫?index full scan) 与全表扫描对应,也有相应的全索引扫描。而且此时查询出的数据都必M索引中可以直接得到?/span> 全烦引扫描的例子Q?/span> An Index full scan will not perform single block i/o's and so it may prove to be inefficient. e.g. Index BE_IX is a concatenated index on big_emp (empno, ename) Query Plan -------------------------------------------------------------------------------- SELECT STATEMENT[CHOOSE] Cost=26 INDEX FULL SCAN BE_IX [ANALYZED] 扫描索引中的所有的数据块,?index full scan很类|但是一个显著的区别是它不Ҏ询出的数据进行排序,x据不是以排序序被返回。在q种存取Ҏ中,可以使用多块d能,也可以用ƈ行读入,以便获得最大吞吐量与羃短执行时间?/span> 索引快速扫描的例子Q?/span> BE_IX索引是一个多列烦引: big_emp (empno,ename) SQL> explain plan for select empno,ename from big_emp; Query Plan ------------------------------------------ SELECT STATEMENT[CHOOSE] Cost=1 INDEX FAST FULL SCAN BE_IX [ANALYZED] SQL> explain plan for select ename from big_emp; Query Plan ------------------------------------------ SELECT STATEMENT[CHOOSE] Cost=1 INDEX FAST FULL SCAN BE_IX [ANALYZED] ?表之间的q接 Join是一U试囑ְ两个表结合在一L谓词Q一ơ只能连?个表Q表q接也可以被UCؓ表关联。在后面的叙 qCQ我们将会?#8221;row source”来代?#8221;?#8221;Q因Z用row source更严谨一些,q且参与连接的2个row source分别UCؓrow source1和row source 2。Joinq程的各个步骤经常是串行操作Q即使相关的row source可以被ƈ行访问,卛_以ƈ行的d做joinq接的两个row source的数据,但是在将表中W合限制条g的数据读入到内存形成row source后,join的其它步骤一般是串行的。有多种Ҏ可以?个表q接hQ当然每U方法都有自q优缺点,每种q接cd只有在特定的条g下才?发挥出其最大优ѝ?/span> row source(?之间的连接顺序对于查询的效率有非常大的媄响。通过首先存取特定的表Q即该表作为驱动表Q这样可以先应用某些限制条gQ从而得C?较小的row sourceQɘq接的效率较高,q也是我们常说的要先执行限制条件的原因。一般是在将表读入内存时Q应用where子句中对该表的限制条件?/span> Ҏ2个row source的连接条件的中操作符的不同,可以连接分为等D?如WHERE A.COL3 = B.COL4)、非{D?WHERE A.COL3 > B.COL4)、外q接(WHERE A.COL3 = B.COL4(+))。上面的各个q接的连接原理都基本一P所以ؓ了简单期_下面以等D接ؓ例进行介l?/span> 在后面的介绍中,都已Q?/span> SELECT A.COL1, B.COL2 FROM A, B WHERE A.COL3 = B.COL4; Zq行说明Q假设A表ؓRow Soruce1Q则其对应的q接操作兌列ؓCOL 3QB表ؓRow Soruce2Q则其对应的q接操作兌列ؓCOL 4Q?/span> q接cdQ?/span> 目前为止Q无接操作符如何Q典型的q接cd共有3U: 排序 - - 合ƈq接(Sort Merge Join (SMJ) ) 嵌套循环(Nested Loops (NL) ) 哈希q接(Hash Join) 排序 - - 合ƈq接(Sort Merge Join, SMJ) 内部q接q程Q?/span> 1) 首先生成row source1需要的数据Q然后对q些数据按照q接操作兌?如A.col3)q行排序?/span> 2) 随后生成row source2需要的数据Q然后对q些数据按照与sort source1对应的连接操作关联列(如B.col4)q行排序?/span> 3) 最后两边已排序的行被放在一h行合q操作,卛_2个row source按照q接条gq接h 下面是连接步骤的囑Ş表示Q?/span> MERGE /\ SORTSORT || Row Source 1Row Source 2 如果row source已经在连接关联列上被排序Q则该连接操作就不需要再q行sort操作Q这样可以大大提高这U连接操作的q接速度Q因为排序是个极其费资源的操 作,特别是对于较大的表。预先排序的row source包括已经被烦引的?如a.col3或b.col4上有索引)或row source已经在前面的步骤中被排序了。尽合q两个row source的过E是串行的,但是可以q行讉Kq两个row source(如ƈ行读入数据,q行排序). SMJq接的例子: select /*+ ordered */ e.deptno, d.deptno from emp e, dept d where e.deptno = d.deptno order by e.deptno, d.deptno;
------------------------------------- SELECT STATEMENT [CHOOSE] Cost=17 MERGE JOIN SORT JOIN TABLE ACCESS FULL EMP [ANALYZED] SORT JOIN TABLE ACCESS FULL DEPT [ANALYZED] 嵌套循环(Nested Loops, NL) q个q接Ҏ有驱动表(外部?的概c其实,该连接过E就是一?层嵌套@环,所以外层@环的ơ数少好Q这也就是我们ؓ什么将表或返回较?row source的表作ؓ驱动?用于外层循环)的理Z据。但是这个理论只是一般指导原则,因ؓ遵@q个理论q不能M证语句产生的I/Oơ数最。有?不遵守这个理Z据,反而会获得更好的效率。如果用这U方法,军_使用哪个表作为驱动表很重要。有时如果驱动表选择不正,会D语句的性能很差、很 差?/span> 内部q接q程Q?/span> Row source1的Row 1 ---------------- Probe ->Row source 2 Row source1的Row 2 ---------------- Probe ->Row source 2 Row source1的Row 3 ---------------- Probe ->Row source 2 ……. Row source1的Row n ---------------- Probe ->Row source 2 从内部连接过E来看,需要用row source1中的每一行,d配row source2中的所有行Q所以此时保持row source1可能的与高效的访问row source2(一般通过索引实现)是媄响这个连接效率的关键问题。这只是理论指导原则Q目的是使整个连接操作生最的物理I/Oơ数Q而且如果遵守q?个原则,一般也会ȝ物理I/O数最。但是如果不遵从q个指导原则Q反而能用更的物理I/O实现q接操作Q那管q反指导原则吧!因ؓ最的物理 I/Oơ数才是我们应该遵从的真正的指导原则Q在后面的具体案例分析中qL例子?/span> 在上面的q接q程中,我们URow source1为驱动表或外部表。Row Source2被称探查表或内部表?/span> 在NESTED LOOPSq接中,Oracledrow source1中的每一行,然后在row sourc2中检查是否有匚w的行Q所有被匚w的行都被攑ֈl果集中Q然后处理row source1中的下一行。这个过E一直l,直到row source1中的所有行都被处理。这是从q接操作中可以得到第一个匹配行的最快的Ҏ之一Q这U类型的q接可以用在需要快速响应的语句中,以响应速度?主要目标?/span> 如果driving row source(外部?比较,q且在inner row source(内部?上有唯一索引Q或有高选择性非唯一索引Ӟ使用q种Ҏ可以得到较好的效率。NESTED LOOPS有其它连接方法没有的的一个优ҎQ可以先q回已经q接的行Q而不必等待所有的q接操作处理完才q回数据Q这可以实现快速的响应旉?/span> 如果不用ƈ行操作,最好的驱动表是那些应用了where 限制条g后,可以q回较少行数据的的表Q所以大表也可能UCؓ驱动表,关键看限制条件。对于ƈ行查询,我们l常选择大表作ؓ驱动表,因ؓ大表可以充分利用q?行功能。当Ӟ有时Ҏ询用ƈ行操作ƈ不一定会比查询不使用q行操作效率高,因ؓ最后可能每个表只有很少的行W合限制条gQ而且q要看你的硬仉|是?可以支持q行(如是否有多个CPUQ多个硬盘控制器)Q所以要具体问题具体对待?/span> NLq接的例子: SQL> explain plan for select a.dname,b.sql from dept a,emp b where a.deptno = b.deptno; Query Plan ------------------------- SELECT STATEMENT [CHOOSE] Cost=5 NESTED LOOPS TABLE ACCESS FULL DEPT [ANALYZED] TABLE ACCESS FULL EMP [ANALYZED] q种q接是在oracle 7.3以后引入的,从理Z来说比NL与SMJ更高效,而且只用在CBO优化器中?/span> 较小的row source被用来构建hash table与bitmapQ第2个row source被用来被hansedQƈ与第一个row source生成的hash tableq行匚wQ以便进行进一步的q接。Bitmap被用来作ZU比较快的查找方法,来检查在hash table中是否有匚w的行。特别的Q当hash table比较大而不能全部容U_内存中时Q这U查找方法更为有用。这U连接方法也有NLq接中所谓的驱动表的概念Q被构徏为hash table与bitmap的表为驱动表Q当被构建的hash table与bitmap能被容纳在内存中Ӟq种q接方式的效率极高?/span> HASHq接的例子: SQL> explain plan for select /*+ use_hash(emp) */ empno from emp, dept where emp.deptno = dept.deptno; Query Plan ---------------------------- SELECT STATEMENT[CHOOSE] Cost=3 HASH JOIN TABLE ACCESS FULL DEPT TABLE ACCESS FULL EMP ȝ一下,在哪U情况下用哪U连接方法比较好Q?/span> 排序 - - 合ƈq接(Sort Merge Join, SMJ)Q?/span> a) 对于非等D接,q种q接方式的效率是比较高的?/span> b) 如果在关联的列上都有索引Q效果更好?/span> c) 对于?个较大的row source做连接,该连接方法比NLq接要好一些?/span> d) 但是如果sort mergeq回的row sourceq大Q则又会D使用q多的rowid在表中查询数据时Q数据库性能下降Q因多的I/O?/span> 嵌套循环(Nested Loops, NL)Q?/span> a) 如果driving row source(外部?比较,q且在inner row source(内部?上有唯一索引Q或有高选择性非唯一索引Ӟ使用q种Ҏ可以得到较好的效率?/span> b) NESTED LOOPS有其它连接方法没有的的一个优ҎQ可以先q回已经q接的行Q而不必等待所有的q接操作处理完才q回数据Q这可以实现快速的响应旉?/span> 哈希q接(Hash Join, HJ)Q?/span> a) q种Ҏ是在oracle7后来引入的,使用了比较先q的q接理论Q一般来_其效率应该好于其?U连接,但是q种q接只能用在CBO优化器中Q而且需要设|合适的hash_area_size参数Q才能取得较好的性能?/span> b) ?个较大的row source之间q接时会取得相对较好的效率,在一个row source较小时则能取得更好的效率?/span> c) 只能用于{D接中 W卡儿乘U?Cartesian Product) 当两个row source做连接,但是它们之间没有兌条gӞ׃在两个row source中做W卡儿乘U,q通常q写代码疏漏造成(即程序员忘了写关联条?。笛卡尔乘积是一个表的每一行依ơ与另一个表中的所有行匚w。在Ҏ?况下我们可以使用W卡儿乘U,如在星Şq接中,除此之外Q我们要量使用W卡儿乘U,否则Q自己想l果是什么吧Q?/span> 注意在下面的语句中,?个表之间没有q接?/span> SQL> explain plan for select emp.deptno,dept,deptno from emp,dept Query Plan ------------------------ SLECT STATEMENT [CHOOSE] Cost=5 MERGE JOIN CARTESIAN TABLE ACCESS FULL DEPT SORT JOIN TABLE ACCESS FULL EMP
一、什么是执行计划
二、如何访问数?/strong>
Full Table Scan (FTS) --全表扫描
Index Lookup (unique & non-unique) --索引扫描Q唯一和非唯一Q?/span>
Rowid --物理行id
三、执行计划层ơ关p?/strong>
-----------------------------------------
SELECT STATEMENT [CHOOSE] Cost=1234
**TABLE ACCESS FULL LARGE [:Q65001] [ANALYZED] --[:Q65001]表示是ƈ行方式,[ANALYZED]表示该对象已l分析过?/span>
SELECT STATEMENT [CHOOSE] Cost= --Cost为空Q采用RBO
PARENT1
**FIRST CHILD
****FIRST GRANDCHILD
**SECOND CHILD
四、例子解?/strong>
----------------------------------------------------------
0 **SELECT STATEMENT Optimizer=CHOOSE (Cost=3 Card=8 Bytes=248)
1 0 **HASH JOIN (Cost=3 Card=8 Bytes=248)
2 1 ****TABLE ACCESS (FULL) OF 'DEPT' (Cost=1 Card=3 Bytes=36)
3 1 ****TABLE ACCESS (FULL) OF 'EMP' (Cost=1 Card=16 Bytes=304)
Execution starts with ID=0: SELECT STATEMENT but this is dependand on it's child objects
So it executes its first child step: ID=1 PID=0 HASH JOIN but this is dependand on it's child objects
So it executes its first child step: ID=2 PID=1 TABLE ACCESS (FULL) OF 'DEPT'
Then the second child step: ID=3 PID=2 TABLE ACCESS (FULL) OF 'EMP'
Rows are returned to the parent step(s) until finished
五、表讉K方式
------------------------------------
SELECT STATEMENT [CHOOSE] Cost=1
**INDEX UNIQUE SCAN EMP_I1 --如果索引里就扑ֈ了所要的数据Q就不会再去讉K表了
Method for looking up a single key value via a unique index. always returns a single value, You must supply AT LEAST the leading column of the index to access data via the index.
eg:
SQL> explain plan for select empno,ename from emp where empno=10;
index range scan --索引局部扫?/span>
Index range scan is a method for accessing a range values of a particular column. AT LEAST the leading column of the index must be supplied to access data via the index. Can be used for range operations (e.g. > < <> >= <= between) .
eg:
SQL> explain plan for select mgr from emp where mgr = 5;
Full index scans are only available in the CBO as otherwise we are unable to determine whether a full scan would be a good idea or not. We choose an index Full Scan when we have statistics that indicate that it is going to be more efficient than a Full table scan and a sort. For example we may do a Full index scan when we do an unbounded scan of an index and want the data to be ordered in the index order.
eg:
SQL> explain plan for select empno,ename from big_emp order by empno,ename;
Scans all the block in the index, Rows are not returned in sorted order, Introduced in 7.3 and requires V733_PLANS_ENABLED=TRUE and CBO, may be hinted using INDEX_FFS hint, uses multiblock i/o, can be executed in parallel, can be used to access second column of concatenated indexes. This is because we are selecting all of the index.
eg:
SQL> explain plan for select empno,ename from big_emp;
index skip scan --索引跌扫描Qwhere条g列是非烦引的前导列情况下常发?br />Index skip scan finds rows even if the column is not the leading column of a concatenated index. It skips the first column(s) during the search.
eg:
SQL> create index i_emp on emp(empno, ename);
SQL> select /*+ index_ss(emp i_emp)*/ job from emp where ename='SMITH';
六、表q接方式
select /*+ ordered */ e.deptno,d.deptno
from emp e,dept d
where e.deptno = d.deptno
order by e.deptno,d.deptno;
Query Plan
-------------------------------------
SELECT STATEMENT [CHOOSE] Cost=17
**MERGE JOIN
****SORT JOIN
******TABLE ACCESS FULL EMP [ANALYZED]
****SORT JOIN
******TABLE ACCESS FULL DEPT [ANALYZED]
For nested loops to be efficient it is important that the first row source returns as few rows as possible as this directly controls the number of probes of the second row source. Also it helps if the access method for row source 2 is efficient as this operation is being repeated once for every row returned by row source 1.
select a.dname,b.sql
from dept a,emp b
where a.deptno = b.deptno;
-------------------------
SELECT STATEMENT [CHOOSE] Cost=5
**NESTED LOOPS
****TABLE ACCESS FULL DEPT [ANALYZED]
****TABLE ACCESS FULL EMP [ANALYZED]
select /*+ use_hash(emp) */ empno
from emp,dept
where emp.deptno = dept.deptno;
----------------------------
SELECT STATEMENT [CHOOSE] Cost=3
**HASH JOIN
****TABLE ACCESS FULL DEPT
****TABLE ACCESS FULL EMP
It can be useful in some circumstances - Star joins uses cartesian products.Notice that there is no join between the 2 tables:
select emp.deptno,dept,deptno
from emp,dept
------------------------------
SLECT STATEMENT [CHOOSE] Cost=5
**MERGE JOIN CARTESIAN
****TABLE ACCESS FULL DEPT
****SORT JOIN
******TABLE ACCESS FULL EMP
order by clauses
group by
sort merge join
eg:
SQL> explain plan for
select ename,tot
from emp,(select empno,sum(empno) tot from big_emp group by empno) tmp
where emp.empno = tmp.empno;
------------------------
SELECT STATEMENT [CHOOSE]
**HASH JOIN
**TABLE ACCESS FULL EMP [ANALYZED]
**VIEW
****SORT GROUP BY
******INDEX FULL SCAN BE_IX
]]>
3Q烦引扫描(Index Scan或index lookupQ?/span>
SQL> explain plan for select empno, ename from emp where empno=10;
但是如果查询的数据能全在索引中找刎ͼ可以避免进行第2步操作,避免了不必要的I/OQ此时即佉K过索引扫描取出的数据比较多Q效率还是很高的
SQL> explain plan for select empno, ename from emp
从这个例子中可以看到Q因为烦引是已经排序了的Q所以将按照索引的顺序查询出W合条g的行Q因此避免了q一步排序操作?/span>
SQL> explain plan for select empno,ename from emp
SQL> explain plan for select empno, ename from big_emp order by empno,ename;
(4) 索引快速扫?index fast full scan)
只选择多列索引的第2列:
SQL> explain plan for
Query Plan
排序是一个费时、费资源的操作,特别对于大表。基于这个原因,SMJl常不是一个特别有效的q接ҎQ但是如?个row source都已l预先排序,则这U连接方法的效率也是蛮高的?/span>
哈希q接(Hash Join, HJ)
要哈希q接有效Q需要设|HASH_JOIN_ENABLED=TRUEQ缺省情况下该参CؓTRUEQ另外,不要忘了q要讄 hash_area_size参数Q以使哈希连接高效运行,因ؓ哈希q接会在该参数指定大的内存中运行,q小的参C使哈希连接的性能比其他连接方式还 要低?/span>
CARTESIAN关键字指Z?个表之间做笛卡尔乘积。假如表emp有n行,dept表有m行,W卡乘U的l果是得到n * m行结果?/span>
]]>
高效Q?span lang="EN-US">
1. SELECT LOC_ID ?/span> LOC_DESC Q?/span>REGION FROM LOCATION WHERE LOC_ID = 10 UNION SELECT LOC_ID Q?/span>
LOC_DESC Q?/span>REGION FROM LOCATION WHERE REGION = “MELBOURNE”
低效:
1. SELECT LOC_ID Q?/span>LOC_DESC Q?/span>REGION FROM LOCATION WHERE LOC_ID = 10 OR REGION = “MELBOURNE”
?span lang="EN-US">IN来替?span lang="EN-US">ORQ?/span>
q是一条简单易记的规则Q但是实际的执行效果q须验,?span lang="EN-US">Oracle8i下,两者的执行路径g是相同的:
低效:
1. SELECT…. FROM LOCATION WHERE LOC_ID = 10 OR LOC_ID = 20 OR LOC_ID = 30
高效Q?span lang="EN-US">
1. SELECT… FROM LOCATION WHERE LOC_IN IN (10,20,30);
避免在烦引列上?span lang="EN-US">IS NULL?span lang="EN-US">IS NOT NULLQ?/span>
避免在烦引中使用M能够为空的列Q?span lang="EN-US">Oracle无法用该索引。对于单列烦引,假如列包含空|索引中将不存在此记录。对于复合烦引,假如每个列都为空Q烦引中同样不存在此记录。假如至有一个列不ؓI,则记录存在于索引中。D例:假如唯一性烦引徏立在表的A列和B列上Qƈ且表中存在一条记录的 AQ?span lang="EN-US">Bgؓ(123Q?span lang="EN-US">null)Q?span lang="EN-US"> Oracle不接受下一条具备相?span lang="EN-US">AQ?span lang="EN-US">B|123,nullQ的记录(插入)。然而假如Q何的索引列都为空Q?span lang="EN-US">Oracle认为整个键gؓI空不等于空。因此您能够插入1000 条具备相同键值的记录,当然他们都是I?span lang="EN-US">! 因ؓIg存在于烦引列?span lang="EN-US">,所?span lang="EN-US">WHERE子句中对索引列进行空值比较将?span lang="EN-US">ORACLE停用该烦引?span lang="EN-US">
L使用索引的第一个列Q?/span>
假如索引是徏立在多个列上Q只有在他的W一个列(leading column)?span lang="EN-US">where子句引用Ӟ优化器才会选择使用该烦引。这也是一条简单而重要的规则Q当仅引用烦引的W二个列Ӟ优化器用了全表扫描而忽略了索引?span lang="EN-US">
?span lang="EN-US">Oracle UNION ALL替换UNION ( 假如有可能的?span lang="EN-US">)Q?/span>
?span lang="EN-US">SQL语句需?span lang="EN-US">UNION两个查询l果集合Ӟq两个结果集合会?span lang="EN-US">Oracle UNION ALL的方式被合ƈQ然后在输出最l结果前q行排序。假如用 Oracle UNION ALL替代UNIONQ这h序就不是必要了。效率就会因此得到提高。需要注意的是,Oracle UNION ALL重复输Z个结果集合中相同记录。因此各位还是要从业务需求分析?span lang="EN-US">Oracle UNION ALL的可行性?span lang="EN-US"> UNION 对l果集合排序,q个操作会用到SORT_AREA_SIZEq块内存。对于这块内存的优化也是相当重要的?span lang="EN-US">
试用例Q?/span>
Student student = (Student)session.get(Student.class, 1);
System.out.println(student.getName());
System.out.println(student.getClasses().getName());
1Q保?/span>默认Q同fetch="select",如:
<many-to-one name="classes" column="classesid" fetch="select"/>
fetch="select",另外发送一?/span>select语句抓取当前对象兌实体或集?/span>
执行l果Q?/span>2条语?/span>
Hibernate: select student0_.id as id1_0_, student0_.name as name1_0_, student0_.class_id as class3_1_0_ from student_join student0_ where student0_.id=?
学生1
Hibernate: select classes0_.id as id0_0_, classes0_.name as name0_0_ from classes_join classes0_ where classes0_.id=?
高一(1)?/span>
======================================
2Q设|?/span>fetch="join",如:
<many-to-one name="classes" column="classesid" fetch="join"/>
fetch="join",hibernate会通过select语句使用外连接来加蝲其关联实体或集合
此时lazy会失?/span>
执行l果Q一?/span>join语句
Hibernate: select student0_.id as id1_1_, student0_.name as name1_1_, student0_.class_id as class3_1_1_, classes1_.id as id0_0_, classes1_.name as name0_0_ from student_join student0_ left outer join classes_join classes1_ on student0_.class_id=classes1_.id where student0_.id=?
学生1
高一(1)?/span>
======================================================
二?/span>hibernate抓取{略Q集合代理的扚w抓取Q?/span>fetch=selectQ默认)/join/subselectQ?/span>
试用例Q?/span>
Classes c = (Classes) session.load(Classes.class, new Integer(1));
System.out.println("Class.name=" + c.getName());
Set stuSet = c.getStudents();
System.out.println(stuSet.size());
if(stuSet != null && !stuSet.isEmpty()){
for(Iterator it = stuSet.iterator(); it.hasNext();){
Student s = (Student) it.next();
System.out.println("student.name=" + s.getName());
}
}
1Q保持默认,?/span>fetch="select",如:
<set name="students" inverse="true" fetch="select">
fetch="select",另外发送一?/span>select语句抓取当前对象兌实体或集?/span>
试l果Q?/span>2条独立的查询语句
Hibernate: select classes0_.id as id0_0_, classes0_.name as name0_0_ from classes_join classes0_ where classes0_.id=?
Class.name=高一(1)?/span>
Hibernate: select students0_.class_id as class3_1_, students0_.id as id1_, students0_.id as id1_0_, students0_.name as name1_0_, students0_.class_id as class3_1_0_ from student_join students0_ where students0_.class_id=?
9
student.name=学生7
student.name=学生3
student.name=学生1
student.name=学生8
student.name=学生2
student.name=学生4
student.name=学生5
student.name=学生9
student.name=学生6
(2)讄fetch="join",如:
<set name="students" inverse="true" fetch="join">
fetch="join",hibernate会通过select语句使用外连接来加蝲其关联实体或集合
此时lazy会失?/span>
试l果Q?/span>1条独立的join查询语句
Hibernate: select classes0_.id as id0_1_, classes0_.name as name0_1_, students1_.class_id as class3_3_, students1_.id as id3_, students1_.id as id1_0_, students1_.name as name1_0_, students1_.class_id as class3_1_0_ from classes_join classes0_ left outer join student_join students1_ on classes0_.id=students1_.class_id where classes0_.id=?
Class.name=高一(1)?/span>
9
student.name=学生6
student.name=学生4
student.name=学生9
student.name=学生7
student.name=学生2
student.name=学生3
student.name=学生8
student.name=学生1
student.name=学生5
(3)讄fetch="subselect",如:用在查询语句?/span>
<set name="students" inverse="true" fetch="subselect">
fetch="subselect",另外发送一?/span>select语句抓取在前面查询到的所有实体对象的兌集合
试用例Q?/span>
List classList = session.createQuery("from Classes where id in (1,2,3)").list();
for(Iterator iter = classList.iterator(); iter.hasNext();){
Classes c = (Classes)iter.next();
System.out.println("Class.name=" + c.getName());
Set stuSet = c.getStudents();
System.out.println(stuSet.size());
if(stuSet != null && !stuSet.isEmpty()){
for(Iterator it = stuSet.iterator(); it.hasNext();){
Student s = (Student) it.next();
System.out.println("student.name=" + s.getName());
}
}
}
当不?/span>fetch="subselect" ,卻I<set name="students" inverse="true">,l果如下Q?/span>
执行?/span>3条查询语?/span>
Hibernate: select classes0_.id as id0_, classes0_.name as name0_ from classes_join classes0_ where classes0_.id in (1 , 2 , 3)
Class.name=高一(1)?/span>
Hibernate: select students0_.class_id as class3_1_, students0_.id as id1_, students0_.id as id1_0_, students0_.name as name1_0_, students0_.class_id as class3_1_0_ from student_join students0_ where students0_.class_id=?
9
student.name=学生8
student.name=学生5
student.name=学生3
student.name=学生9
student.name=学生7
student.name=学生1
student.name=学生4
student.name=学生6
student.name=学生2
Class.name=高一(2)?/span>
Hibernate: select students0_.class_id as class3_1_, students0_.id as id1_, students0_.id as id1_0_, students0_.name as name1_0_, students0_.class_id as class3_1_0_ from student_join students0_ where students0_.class_id=?
4
student.name=学生3
student.name=学生4
student.name=学生1
student.name=学生2
Class.name=高一(3)?/span>
Hibernate: select students0_.class_id as class3_1_, students0_.id as id1_, students0_.id as id1_0_, students0_.name as name1_0_, students0_.class_id as class3_1_0_ from student_join students0_ where students0_.class_id=?
0
当不?/span>fetch="subselect" ,卻I<set name="students" inverse="true" fetch="subselect">,l果如下Q?/span>
执行?/span>1条查询语句(嵌套子查询)
Hibernate: select classes0_.id as id0_, classes0_.name as name0_ from classes_join classes0_ where classes0_.id in (1 , 2 , 3)
Class.name=高一(1)?/span>
Hibernate: select students0_.class_id as class3_1_, students0_.id as id1_, students0_.id as id1_0_, students0_.name as name1_0_, students0_.class_id as class3_1_0_ from student_join students0_ where students0_.class_id in (select classes0_.id from classes_join classes0_ where classes0_.id in (1 , 2 , 3))
9
student.name=学生8
student.name=学生4
student.name=学生5
student.name=学生9
student.name=学生6
student.name=学生2
student.name=学生3
student.name=学生1
student.name=学生7
Class.name=高一(2)?/span>
4
student.name=学生3
student.name=学生4
student.name=学生2
student.name=学生1
Class.name=高一(3)?/span>
0
1.量使用many-to-oneQ避免用单one-to-many
2.灉|使用单向one-to-many
3.不用一对一Q用多对一代替一对一
4.配置对象~存Q不使用集合~存
5.一对多使用Bag 多对一使用Set
6.l承使用昄多?nbsp; HQL:from object polymorphism="exlicit" 避免查处所有对?br />7.消除大表Q用二U缓?br /> 对于上面q些QRobbinq行了详l的讲解?br />one-to-manyQ?/strong>
使用inverse=false(default)Q对象的兌关系是由parent对象来维护的
而inverse=true的情况下Q一般用户双向多对多兌Q由子对象维护关联关p,增加子对象的时候需要显C:child.setParent(child)
Z提高性能Q应该尽量用双向one-to-many inverse=trueQ在MVCl构中的DAO接口中应该直接用Session持久化对象,避免通过兌关系Q这句话有点不理解)Q而在单项关系中正用二U缓存,则可以大q提高以查询Z的应用?br /> 多对一性能问题比较,但是要避免经典N+1问题?br /> 通过主键q行兌Q相当于大表拆分表。(q个是区分面向对象设计和面向q程设计的一个关键点Q?br />list、bag、set的正运?/strong>
one-to-manyQ?br /> A、用list 需要维护Index Column字段Q不能被用于双向兌Q而且必须使用inverse=falseQ需要}慎用在某些E有场合(基本上是不予考虑使用Q?br /> B、bag/set在one-to-many中语义基本相同,推荐使用bag
many-to-oneQ?br /> A、bag和set不同Qbag允许重复插入Q徏议用set
在庞大的集合分页中应该用session.createFilter
session.createFilter(parent.getChildren(),""),setFirstResult(0),setMaxResult(10))
避免N+1 参考(http://www.iteye.com/post/266972Q?/strong>
在多对一的情况下Q查询child对象Q当在页面上昄每个子类的父cd象的时候会DN+1ơ查询,需要采用下面的Ҏ避免Qmany-to-one fetch="join|select"Q该Ҏ可能有问题)
inverse=true 无法l护集合~存Q还不是很理解集合缓存和对象~存Q?/strong>
OLTPcd的web应用Q可以群集水qx展,不可避免的出现数据库瓉
框架能降低访问数据库的压力,采用~存是衡量一个框架是否优U的重要标准,从缓存方面看Hibernate
A、对象缓存,l颗_度Q是针对表的U别Q透明化访问,因ؓ有不改变代码的好处,所以是ORM提高性能的法?br /> B、Hibernate是目前ORM框架中缓存性能最好的框架
C、查询缓?br />最后Robbinq针对大家经常出现的Hibernate vs iBatis的讨行了一个ȝQ?br /> 对于OLTP应用Q用ORM框架 而OLEB应用Q不定是什么应用)最好采用JDBC或者其他方法处?br /> Hibernate們于细颗粒度设计,面向对象Q将大表拆分为多个小表,消除冗余字段Q通过二~存提升性能?br /> iBatis們于粗颗粒度设计,面向关系Q尽量把表合qӞ通过Column冗余Q消除关联关p,但是iBatis没有有效的缓存手Dc?/span>
可以说Robbin的性能ȝ对于使用Hibernate的开发h员有着很重要的Ҏ作用。非常感谢他无私奉献自己的经验?/span>
HQL看v来和SQL很相伹{从HQL的WHERE子句中通常可以猜到相应的SQL WHERE子句。WHERE子句中的字段军_了数据库选择的烦引?/p>
大多数Hibernate开发者所常犯的一个错误是无论何时Q当需要新WHERE子句的时候都会创Z个新的烦引。因为烦引会带来额外的数据更新开销Q所以应该争取创建少量烦引来覆盖可能多的查询?br />4.1?/strong>让你使用一个集合来处理所有可能的数据搜烦条g。如果这不太实际Q那么你可以使用后端剖析工具来创Z个针对应用程序涉及的所有SQL的集合。基于那些搜索条件的分类Q你最l会得到一个小的烦引集。与此同Ӟq可以尝试向WHERE子句中添加额外的谓语来匹配其他WHERE子句?/p>
范例7 有两个UI搜烦器和一个后端守护进E搜索器来搜索名为iso_deals的表。第一个UI搜烦器在unexpectedFlag、dealStatus、tradeDate和isold属性上有谓语?/p>
W二个UI搜烦器基于用户键入的qo器,其中包括的内定wtradeDate和isold以外q有其他属性。开始时所有这些过滤器属性都是可选的?br />后端搜烦器基于isold、participantCode和transactionType属性?br />l过q一步业务分析,发现W二个UI搜烦器实际是Z一些隐式的unexpectedFlag和dealStatus值来选择数据的。我们还让tradeDate成ؓqo器的必要属性(Z使用数据库烦引,每个搜烦qo器都应该有必要属性)?/p>
鉴于q一点,我们依次使用unexpectedFlag、dealStatus、tradeDate和isold构造了一个复合烦引。两个UI搜烦器都能共用它。(序很重要,如果你的谓语以不同的序指定q些属性或在它们前|列了其他属性,数据库就不会选择该复合烦引。) 后端搜烦器和UI搜烦器区别太大,因此我们不得不ؓ它构造另一个复合烦引,依次使用isold、participantCode和transactionType?/p> 既可以用绑定参数构造HQL的WHERE子句Q也可以使用字符串拼接的ҎQ该军_Ҏ能会有一定媄响。用绑定参数的原因是让数据库一ơ解析SQLQ对后箋的重复请求复用生成好的执行计划,q样做节省了CPU旉和内存。然而,到最优的数据讉K效率Q不同的l定值可能需要不同的SQL执行计划?/p>
例如Q一段数据范围可能只返回数据总量?%Q而一大段数据范围可能q回数据总量?0%。前者用烦引更好,而后者则最好用全表扫描?/p>
OLTP使用l定参数Q数据仓库用字W串拼接Q因为OLTP通常在一个事务中重复插入和更新数据,只取量数据Q数据仓库通常只有量SQL查询Q有一个确定的执行计划比节省CPU旉和内存更为重要?/p>
要是你知道你的OLTP搜烦对不同绑定值应该用相同执行计划又该怎么办呢Q?/p>
Oracle 9i及以后版本在W一ơ调用绑定参数ƈ生成执行计划时能探出参数倹{后l调用不会再探测Q而是重用之前的执行计划?/p>
你可以在数据库中q行聚合?#8220;order by”Q也可以在应用程序的服务层中事先加蝲所有数据然后做聚合?#8220;order by”操作。推荐用前者,因ؓ数据库在q方面通常会比你的应用E序做得好。此外,q样做还能节省网l带宽,q也是一U拥有跨数据库移植性的做法?/p>
当你的应用程序对数据聚合和排序有HQL不支持的特定业务规则旉外?/p>
详见4.7.1?/strong>?/p>
本地查询调优其实q不直接与HQL有关。但HQL的确可以让你直接向底层数据库传递本地查询。我们ƈ不徏议这么做Q因为本地查询在数据库间不可UL?/p>
抓取{略军_了在应用E序需要访问关联对象时QHibernate以何U方式以及何时获取关联对象。HRD中的W?0?#8220;改善性能”对该主题作了很好的阐qͼ我们在此关注它的用方法?/p>
不同的用户可能会有不同的数据抓取要求。Hibernate允许在两个地方定义数据抓取策略,一处是在映元数据中,另一处是在HQL或Criteria中覆盖它?/p>
常见的做法是Z主要的抓取用例在映射元数据中定义默认抓取{略Q针对少数用例在HQL和Criteria中覆盖抓取策略?/p>
假设pojoA和pojoB是父子关pd例。如果根据业务规则,只是偶尔需要从实体两端加蝲数据Q那你可以声明一个gq加载集合或代理抓取Qproxy fetchingQ。当你需要从实体两端获取数据Ӟ可以用立x取(eager fetchingQ覆盖默认策略,例如使用HQL或Criteria配置q接抓取Qjoin fetchingQ?/p>
另一斚wQ如果业务规则在大多数时候需要从实体两端加蝲数据Q那么你可以声明立即抓取q在Criteria中设|gq加载集合或代理抓取来覆盖它QHQL目前q不支持q样的覆盖)?/p>
select抓取会导致N+1问题。如果你知道自己L需要从兌中加载数据,那么p始终使用q接抓取。在下面两个场景中,你可能会把N+1视ؓ一U模式而非反模式?/p>
W一U场景,你不知道用户是否会访问关联对象。如果他/Ҏ有访问,那么你赢了;否则你仍焉要额外的Nơselect SQL语句。这是一Uo人左右ؓ隄局面?/p>
W二U场景,pojoA和很多其他POJO有one-to-many兌Q例如pojoB和pojoC。用立即的内连接或外连接抓取会在结果集中将pojoA重复很多ơ。当pojoA中有很多非空属性时Q你不得不将大量数据加蝲到持久层中。这U加载需要很多时_既有|络带宽的原因,如果Hibernate的会话是有状态的Q其中也会有会话~存的原因(内存消耗和GC暂停Q?/p>
如果你有一个很长的one-to-many兌链,例如从pojoA到pojoB到pojoC以此cLQ情况也是类似的?/p>
你也怼M用HQL中的DISTINCT关键字或Cirteria中的distinct功能或是Java的Set接口来消除重复数据。但所有这些都是在HibernateQ在持久层)中实现的Q而非数据库中?/p>
如果Z你的|络和内存配|的试表明N+1性能更好Q那么你可以使用扚w抓取、subselect抓取或二U缓存来做进一步调优?/p>
范例8 以下是一个用批量抓取的HBM文g片段Q?/p> 以下是多端pojoB生成的SQLQ?/p> 问号数量与batch-size值相{。因此Nơ额外的关于pojoB的select SQL语句被减到了N/10ơ?/p>
如果?small>fetch="select"替换?small>fetch="subselect"QpojoB生成的SQL语句是q样的: 管Nơ额外的select减少?ơ,但这只在重复q行pojoA的查询开销很低时才有好处?/p>
如果pojoA中的pojoB集合很稳定,或pojoB有pojoA的many-to-one兌Q而且pojoA是只d用数据,那么你可以用二U缓存来~存pojoA以消除N+1问题Q?strong>4.8.1?/strong>中有一个例子)?/p> 除非有一张拥有很多你不需要的字段的遗留表Q否则不应该使用q种抓取{略Q因为它的gq属性分l会带来额外的SQL?/p>
在业务分析和设计q程中,你应该将不同数据获取或修改分l放C同的领域对象实体中,而不是用这U抓取策略?/p>
如果不能重新设计遗留表,可以使用HQL或Criteria提供的投影功能来获取数据?/p>
HRDW?0.2?“二~存”中的描述对大多数开发者来说过于简单,无法做出选择?.3版及以后版本不再推荐使用Z“CacheProvider”的缓存,而用Z“RegionFactory”的缓存,q也让h更糊涂了。但是就是最新的3.5参考文也没有提及如何使用新缓存方法?/p>
Z下述考虑Q我们将l箋x于老方法: 理解该机制是做出合理选择的关键。关键的c?接口是CacheConcurrencyStrategy和它针对4中不同缓存用的实现c,q有EntityUpdate/Delete/InsertAction?/p>
针对q发~存讉KQ有三种实现模式Q?/p>
无论是锁q是事务都没影响Q因为缓存自数据从数据库加蝲后就不会改变?/p> 对缓存的更新发生在数据库事务完成后。缓存需要支持锁?/p> 对缓存和数据库的更新被包装在同一个JTA事务中,q样~存与数据库L保持同步的。数据库和缓存都必须支持JTA。尽缓存事务内部依赖于~存锁,但Hibernate不会昑ּ调用M的缓存锁函数?/p> 以数据库更新Z。EntityUpdateAction对于事务感知d?#8220;read-write”的非事务感知dQ还?#8220;nonstrict-read-write”的非事务感知d相应有如下调用序列: 软锁只是一U特定的~存值失效表q方式,在它获得新数据库值前L其他事务d~存。那些事务会转而直接读取数据库?/p>
~存必须支持锁;事务支持则不是必ȝ。如果缓存是一个集,“更新~存”的调用会新值推送给所有副本,q通常被称?#8220;推(pushQ?#8221;更新{略?/p> 既不需要支持缓存锁Q也不需要支持事务。如果是~存集群Q?#8220;清除~存”调用会让所有副本都失效Q这通常被称?#8220;拉(pullQ?#8221;更新{略?/p> 对于实体的删除或插入动作Q或者集合变_调用序列都是怼的?/p>
实际上,最后两个异步调用序列仍能保证数据库和缓存的一致性(基本是“read committed”的隔MU别Q,q要归功于第二个序列中的软锁?#8220;更新数据?#8221;后的“更新~存”Q还有最后一个调用序列中的悲?#8220;清除~存”?/p>
Z上述分析Q我们的是: 依笔者看来,二~存q一U数据源Q因此用JTA也未必合理。实际上最后两个调用序列在大多数场景下是个不错的替代方案,q要归功于它们的数据一致性保障?/p> 范例9 以下是一个ISO收费cd的HBM文g片段Q?/p> 一些用户只需要ISO收费cd本nQ一些用h需要ISO收费cdQ还需要它的三个关联对象。简单v见,开发者会立即加蝲所有三个关联对象。如果项目中没h负责Hibernate调优Q这是很常见的?/p>
4.7.1?/strong>中讲q了最好的Ҏ。因为所有的兌对象都是只读引用数据Q另一U方法是使用延迟抓取Q打开q些对象的二U缓存以避免N+1问题。实际上前一U方法也能从引用数据~存中获益?/p>
因ؓ大多数项目都有很多被其他数据引用的只d用数据,上述两种Ҏ都能改善全局pȝ性能?/p> 下表是新老两U方法中对应的主要类/接口Q?
新方?/strong> 老方?/strong> RegionFactory CacheProvider Region Cache EntityRegionAccessStrategy CacheConcurrencyStrategy CollectionRegionAccessStrategy CacheConcurrencyStrategy W一个改q是RegionFactory构徏了特定的RegionQ例如EntityRegion和TransactionRegionQ而不是用一个通用的访问Region。第二个改进是对于特定缓存的“usage”属性|Region要求构徏自己的访问策略,而不是所有Region都一直用CacheConcurrencyStrategy?U实现?/p>
要用新ҎQ应该设|factory_class而非provider_class配置属性。以Ehcache 2.0ZQ?/p> 其他相关的Hibernate~存配置都和老方法一栗?/p>
新方法也能向后兼定w留方法。如果还是只配了CacheProviderQ新Ҏ中将使用下列自说明(self-explanatoryQ适配器和桥隐式地调用老的接口/c: RegionFactoryCacheProviderBridge、EntityRegionAdapter、CollectionRegionAdapter、QueryResultsRegionAdapter、EntityAccessStrategyAdapter和CollectionAccessStrategyAdapter 二~存也能~存查询l果。如果查询开销很大而且要重复运行,q也会很有帮助?/p>
大多数Hibernate的功能都很适合那些每个事务都通常只处理少量数据的OLTPpȝ。但是,如果你有一个数据仓库或者事务需要处理大量数据,那么另当别Z?/p>
如果你已l在使用常规会话了,那这是最自然的方法。你需要做三g事: batch_size讄为正g开启JDBC2的批量更斎ͼHibernate的徏议值是5?0。基于我们的试Q极低值和极高值性能都很差。只要取值在合理范围内,区别只有几U而已。如果网l够快,q个l果是一定的?/p>
W二个配|设为trueQ这要求JDBC驱动在executeBatch()Ҏ中返回正的行数。对于Oracle用户而言Q批量更新时不能其设ؓtrue。请阅读Oracle的《JDBC Developer’s Guide and Reference》中?#8220;标准批处理的Oracle实现中的更新计数”Q?a >Update Counts in the Oracle Implementation of Standard BatchingQ以获得更多详细信息。因为它Ҏ量插入来说还是安全的Q所以你可以为批量插入创建单独的专用数据源。最后一个配|项是可选的Q因Z可以在会话中昑ּ关闭二~存?/p> for ( int i=0; i<100000; i++ ) { 批处理通常不需要数据缓存,否则你会内存耗尽q大量增加GC开销。如果内存有限,那这U情况会很明显?/p> 每次事务修改的对象数量越就意味着会有更多数据库提交,正如4.5?/strong>所q每ơ提交都会带来磁盘相关的开销?/p>
另一斚wQ每ơ事务修改的对象数量多意味着锁定变更旉长Q同时数据库需要更大的redo log?/p>
无状态会话执行v来比上一U方法更好,因ؓ它只是JDBC的简单包装,而且可以l开很多常规会话要求的操作。例如,它不需要会话缓存,也不和Q何二U缓存或查询~存有交互?br />然而它的用法ƈ不简单。尤其是它的操作q不会联到所兌的实例上Q你必须自己来处理它们?/p>
使用DML风格的插入、更新或删除Q你直接在数据库中操作数据,q和前两U方法在Hibernate中操作数据的情况有所不同?/p>
因ؓ一个DML风格的更新或删除相当于前两种Ҏ中的多个单独的更新或删除Q所以如果更新或删除中的WHERE子句暗示了恰当的数据库烦引,那么使用DML风格的操作能节省|络开销Q执行得更好?/p>
强烈l合使用DML风格操作和无状态会话。如果用有状态会话,不要忘记在执行DML前清除缓存,否则Hibernate会更新或清除相关缓存(见下面的范例10Q?/p>
如果你的HQL或Criteria会返回很多数据,那么要注意两件事Q?/p>
fetch_size讄为正值将开启JDBC扚w抓取Ҏ。相对快速网l,在慢速网l中q一Ҏ为重要。Oracle的经验值是10。你应该Z自己的环境进行测试?/p> 范例10 我们有一个后CQ务,分段加蝲大量的IsoDeal数据用于后箋处理。我们还会在分段数据交给下游pȝ处理前将其更Cؓ处理中状态。最大的一D|50万行数据。以下是原始代码中截取出来的一D: 包含上述代码的方法加上了Spring 2.5声明式事务的注解。加载ƈ更新50万行数据大约׃10分钟。我们识别出了以下这些问题: 不幸的是Spring 2.5不支持Hibernate无状态会话,所以我们只能关闭二U缓存;讄fetch_sizeQ用DML风格的更新来代替for循环Q以此改善性能?/p>
但是Q执行时间还是要6分钟。将Hibernate的日志别调成trace后,我们发现是更C话缓存造成了g时。通过在DML更新前清除会话缓存,我们时间羃短到?分钟Q全部都是将数据加蝲C话缓存中p的时间?/p> 本节向你展C如何减SQL生成的数量?/p>
“select抓取”{略会导致N+1问题。如?#8220;q接抓取”{略适合你的话,你应该始l用该{略避免N+1问题?/p>
但是Q如?#8220;q接抓取”{略执行效果不理惻I像4.7.2?/strong>中那P你可以?#8220;subselect抓取”?#8220;扚w抓取”?#8220;延迟集合抓取”来减所需的额外SQL语句数?/p>
范例11 我们的ElectricityDeal与DealCharge有单向one-to-many兌Q如下列HBM文g片段所C: ?#8220;key”元素中,“not-null”?#8220;update”对应的默认值是false和trueQ上qC码ؓ了明这些取|它们写了出来?/p>
如果你想创徏一个ElectricityDeal和十个DealChargeQ会生成如下SQL语句Q?/p>
Z消除那额外的10句更新语句,可以在那10句DealCharge插入语句中包?#8220;DEAL_KEY”Q你需要将“not-null”?#8220;update”分别修改为true和false?/p>
另一U做法是使用双向或many-to-one兌Q让DealCharge来管理关联?/p>
在范?1中,我们为ElectricityDeal加上了select-before-updateQ这会对瞬时QtransientQ对象或分离QdetachedQ对象生额外的select语句Q但却能避免不必要的数据库更新?/p>
你应该做Z些权衡,如果对象没多属性,不需要防止不必要的数据库更新Q那么就不要使用该特性,因ؓ你那些有限的数据既没有太多网l传输开销Q也不会带来太多数据库更新开销?/p>
如果对象的属性较多,例如是一张大的遗留表Q那你应该开启该Ҏ,?#8220;dynamic-update”l合使用以避免太多数据库更新开销?/p>
在范?1中,如果你想删除1个ElectricityDeal和它?00个DealChargeQHibernate会对DealCharge?00ơ删除?/p>
如果?#8220;on-delete”修改?#8220;cascade”QHibernate不会执行DealCharge的删除动作;而是让数据库ҎON CASCADE DELETEU束自动删除?00个DealCharge。不q,需要让DBA开启ON CASCADE DELETEU束Q大多数DBA不愿意这么做Q因Z们想避免父对象的意外删除U联到它的依赖对象上。此外,q要注意Q该Ҏ会l过Hibernate对版本数据(versioned dataQ的常用乐观锁策略?/p>
范例11中用Oracle的序列作为标识符生成器。假设我们保?00个ElectricityDealQHibernate会将下面的SQL语句执行100ơ来获取下一个可用的标识W: 如果|络不是很快Q那q无疑会降低效率?.2.3及后l版本中增加了一个增强的生成?#8220;SequenceStyleGenerator”Q它带了两个优化器:hilo和pooled。尽HRD?a >W??#8220;基础O/R映射” 讲到了这两个优化器,不过内容有限。两个优化器都用了HiLo法Q该法生成的标识符{于Hi值加上Lo|其中Hig表组PLo值顺序且重复C1q代到最大组大小Q组号在Lo?#8220;转回?#8221;1时加1?/p>
假设l大是5Q可以用max_lo或increment_size参数来表C)Q下面是个例子: l号取自数据库序列的下一个可用|Hi值由Hibernate定义Q是l号乘以increment_size参数倹{?/p> Hi值直接取自数据库序列的下一个可用倹{数据库序列的增量应该设|ؓincrement_size参数倹{?/p> 直到内存l中的D尽后,两个优化器才会去讉K数据库,上面的例子每5个标识值符讉K一ơ数据库。用hilo优化器时Q你的序列不能再被其他应用程序用,除非它们使用与Hibernate相同的逻辑。用pooled优化器,在其他应用程序用同一序列时则相当安全?/p>
两个优化器都有一个问题,如果Hibernate崩溃Q当前组内的一些标识符值就会丢失,然而大多数应用E序都不要求拥有q箋的标识符|如果你的数据库,比方说OracleQ缓存了序列|当它崩溃时你也会丢失标识W|?/p>
如果在范?1中用pooled优化器,新的id配置如下Q?/p> 本文늛了大多数你在Hibernate应用E序调优时会觉得很有用的调优技巧,其中的大多数旉都在讨论那些行之有效却缺乏文的调优主题Q例如承映、二U缓存和增强的序列标识符生成器?/p>
它还提到了一些Hibernate调优所必需的数据库知识。一些范例中包含了你可能遇到的问题的实际解决Ҏ?/p>
除此之外Q值得一提的是Hibernate也可以和In-Memory Data GridQIMDGQ一起用,例如Oracle的Coherance或GigaSpaces IMDGQ这能让你的应用E序辑ֈ毫秒U别?/p>
[1] Latest Hibernate Reference Documentation on jboss.com [2] Oracle 9i Performance Tuning Guide and Reference [3] Performance Engineering on Wikipedia [4] Program Optimization on Wikipedia [5] Pareto Principle (the 80/20 rule) on Wikipedia [6] Premature Optimization on acm.org [7] Java Performance Tuning by Jack Shirazi [8] The Law of Leaky Abstractions by Joel Spolsky [9] Hibernate’s StatisticsService Mbean configuration with Spring [11] Java VisualVM [12] Column-oriented DBMS on Wikipedia [13] Apache DBCP BasicDataSource [14] JDBC Connection Pool by Oracle [15] Connection Failover by Oracle [16] Last Resource Commit Optimization (LRCO) [17] GigaSpaces for Hibernate ORM Users
4.6.2l定参数 vs.字符串拼?/h4>
4.6.3聚合及排?/h4>
4.6.4覆盖抓取{略
4.6.5本地查询
4.7抓取{略调优
4.7.1覆盖抓取{略
4.7.2 N+1模式或是反模式?
<class name="pojoA" table="pojoA">
…
<set name="pojoBs" fetch="select" batch-size="10">
<key column="pojoa_id"/>
…
</set>
</class>
select … from pojoB where pojoa_id in(?,?,?,?,?, ?,?,?,?,?);
select … from pojoB where pojoa_id in(select id from pojoA where …);
4.7.3延迟属性抓?/h4>
4.8 二~存调优
4.8.1 ZCacheProvider的缓存机?/h4>
<class name="IsoChargeType">
<property name="isoId" column="ISO_ID" not-null="true"/>
<many-to-one name="estimateMethod" fetch="join" lazy="false"/>
<many-to-one name="allocationMethod" fetch="join" lazy="false"/>
<many-to-one name="chargeTypeCategory" fetch="join" lazy="false"/>
</class>
4.8.2 RegionFactory
<property name="hibernate.cache.region.factory_class">
net.sf.ehcache.hibernate.EhCacheRegionFactory
</property>
4.8.3 查询~存
4.9扚w处理调优
4.9.1使用有状态会话的非DML风格批处?/h5>
hibernate.jdbc.batch_size 30
hibernate.jdbc.batch_versioned_data true
hibernate.cache.use_second_level_cache false
Session session = sessionFactory.openSession();
Transaction tx = session.beginTransaction();
Customer customer = new Customer(.....);
//if your hibernate.cache.use_second_level_cache is true, call the following:
session.setCacheMode(CacheMode.IGNORE);
session.save(customer);
if (i % 50 == 0) { //50, same as the JDBC batch size
//flush a batch of inserts and release memory:
session.flush();
session.clear();
}
}
tx.commit();
session.close();4.9.2使用无状态会话的非DML风格批处?/h4>
4.9.3 DML风格
4.9.4扚w加蝲
hibernate.jdbc.fetch_size 10
Query query = session.createQuery("FROM IsoDeal d WHERE chunk-clause");
query.setLockMode("d", LockMode.UPGRADE); //for Inprocess status update
List<IsoDeal> isoDeals = query.list();
for (IsoDeal isoDeal : isoDeals) { //update status to Inprocess
isoDeal.setStatus("Inprocess");
}
return isoDeals;
4.10 SQL生成调优
4.10.1 N+1抓取问题
4.10.2 Insert+Update问题
<class name="ElectricityDeal"
select-before-update="true" dynamic-update="true"
dynamic-insert="true">
<id name="key" column="ID">
<generator class="sequence">
<param name="sequence">SEQ_ELECTRICITY_DEALS</param>
</generator>
</id>
…
<set name="dealCharges" cascade="all-delete-orphan">
<key column="DEAL_KEY" not-null="false" update="true"
on-delete="noaction"/>
<one-to-many class="DealCharge"/>
</set> </class> 4.10.3 更新前执行select
4.10.4 U联删除
4.10.5 增强的序列标识符生成?/h4>
select SEQ_ELECTRICITY_DEALS.NEXTVAL from dual;
<id name="key" column="ID">
<generator class="org.hibernate.id.enhance.SequenceStyleGenerator">
<param name="sequence_name">SEQ_ELECTRICITY_DEALS</param>
<param name="initial_value">0</param>
<param name="increment_size">100</param>
<param name="optimizer ">pooled</param>
</generator>
</id> 5 ȝ
6 资源
]]>
Hibernate是最行的对象关pL(ORMQ引擎之一Q它提供了数据持久化和查询服务?/p>
调优是一个P代的、持l进行的q程Q涉及Y件开发生命周期(SDLCQ的所有阶Dc在一个典型的使用Hibernateq行持久化的Java EE应用E序中,调优会涉及以下几个方面:
没有一套精心设计的Ҏ去q行以上调优是非常耗时的,而且很可能收效甚微。好的调优方法的重要部分是ؓ调优内容划分优先U。可以用Pareto定律Q又U?#8220;80/20法则”Q来解释q一点,即通常80%的应用程序性能改善源自?0%的性能问题[5]?/p>
相比Z盘和网l的讉KQ基于内存和CPU的访问能提供更低的gq和更高的吞吐量。这U基于IO的Hibernate调优与底层系lIO部分的调优应该优先于ZCPU和内存的底层pȝGC、CPU和内存部分的调优?/p>
范例1
我们调优了一个选择甉|的HQL查询Q把它从30U降C1U以内。如果我们在垃圾回收斚w下功夫,可能收效甚微——也许只有几毫U或者最多几U,相比HQL的改q,GC斚w的改善可以忽略不计?/p>
好的调优Ҏ的另一个重要部分是军_何时优化[4]?/p>
U极优化的提倡者主张开始时p行调优,例如在业务规则和设计阶段Q在整个SDLC都持l进行优化,因ؓ他们认ؓ后期改变业务规则和重新设计代价太大?/p>
另一zh提倡在SDLC末期q行调优Q因Z们抱怨前期调优经怼让设计和~码变得复杂。他们经常引用Donald Knuth的名a“q早优化是万恶之?/em>” [6]?/p>
Zq调优和编码需要一些权衡。根据笔者的l验Q适当的前期调优能带来更明智的设计和细致的~码。很多项目就p|在应用程序调优上Q因Z面提到的“q早优化”阶段在被引用时脱M上下文,而且相应的调优不是被推迟得太晚就是投入资源过?/p>
但是Q要做很多前期调优也不太可能Q因为没有经q剖析,你ƈ不能定应用E序的瓶颈究竟在何处Q应用程序一般都是这h化的?/p>
Ҏ们的多线E企业应用E序的剖析也表现出大多数应用E序q_只有20-50%的CPU使用率。剩余的CPU开销只是在等待数据库和网l相关的IO?/p>
Z上述分析Q我们得样一个结论,l合业务规则和设计的Hibernate调优在Pareto定律?0%的那个部分,相应的它们的优先U更高?/p>
一U比较实际的做法是: 你能在Jack Shirazi的《Java Performance Tuning?[7]一书中扑ֈ更多关于性能调优阶段的常见徏议?/p>
下面的章节中Q我们会按照调优的大致顺序(列在前面的通常影响最大)去解释一些特定的调优技术?/p>
没有对Hibernate应用E序的有效监控和剖析Q你无法得知性能瓉以及何处需要调优?/p>
管使用Hibernate的主要目的是你从直接用SQL的痛苦中解救出来Qؓ了对应用E序q行调优Q你必须知道Hibernate生成了哪些SQL。JoeSplosky在他的《The Law of Leaky Abstractions》一文中详细描述了这个问题?/p>
你可以在log4j中将org.hibernate.SQL包的日志U别设ؓDEBUGQ这样便能看到生成的所有SQL。你q可以将其他包的日志U别设ؓDEBUGQ甚至TRACE来定位一些性能问题?/p>
如果开?strong>hibernate.generate.statisticsQHibernate会导出实体、集合、会话、二U缓存、查询和会话工厂的统计信息,q对通过SessionFactory.getStatistics()q行的调优很有帮助。ؓ了简单v见,Hibernateq可以用MBean“org.hibernate.jmx.StatisticsService”通过JMX来导出统计信息。你可以在这个网站找到配|范?/u> ?/u> 一个好的剖析工具不仅有利于Hibernate调优Q还能ؓ应用E序的其他部分带来好处。然而,大多数商业工P例如JProbe [10]Q都很昂c幸q的是Sun/Oracle的JDK1.6自带了一个名?#8220;Java VisualVM” [11]的调试接口。虽然比起那些商业竞争对手,它还相当基础Q但它提供了很多调试和调优信息?/p>
管业务规则和设计调优ƈ不属于Hibernate调优的范_但此处的军_对后面Hibernate的调优有很大影响。因此我们特意指Z些与Hibernate调优有关的点?/p>
在业务需求收集与调优q程中,你需要知道: Z业务需求,你会得到一个最优设计,其中军_了应用程序类型(是OLTPq是数据仓库Q亦或者与其中某一U比较接q)和分层结构(持久层和服务层分离q是合ƈQ,创徏领域对象Q通常是POJOQ,军_数据聚合的地方(在数据库中进行聚合能利用强大的数据库功能Q节省网l带宽;但是除了像COUNT、SUM、AVG、MIN和MAXq样的标准聚合,其他的聚合通常不具有移植性。在应用服务器上q行聚合允许你应用更复杂的业务逻辑Q但你需要先在应用程序中载入详细的数据)?/p>
范例2 分析员需要查看一个取自大数据表的甉|ISOQIndependent System OperatorQ聚合列表。最开始他们想要显C大多数字段Q尽数据库能在1分钟内做出响应,应用E序也要?0分钟?百万行数据加载到前端UI。经q重新分析,分析员保留了14个字Dc因为去掉了很多可选的高聚合度字段Q从剩下的字D中q行聚合分组q回的数据要很多,而且大多数情况下的数据加载时间也~小C可接受的范围内?/p>
范例3 q?4?#8220;非标?#8221;QshapedQ表C每时都可以有自己的电量和hQ如果所?4时的电量和h相同Q我们称之ؓ“标准”Q小时会修改时甉|交易Q其中包?个属性:每小时电量和h。v初我们用Hibernate?em>select-before-update3. 监控和剖?/h2>
3.1.1 监控SQL生成
3.1.2 查看Hibernatel计
3.1.3 剖析
4. 调优技?/h2>
4.1 业务规则与设计调?/h3>
Ҏ,是更新24行数据需?4ơ选择。因为我们只需?个属性,而且如果不修改电量或h的话也没有业务规则禁止无效修改,我们关闭了select-before-updateҎ,避免?4ơ选择?/p>
管l承映射是领域对象的一部分Q出于它的重要性我们将它单独出来。HRD [1]中的W??#8220;l承映射”已经说得很清楚了Q所以我们将xSQL生成和针Ҏ个策略的调优?/p>
以下是HRD中范例的cdQ?/p>
只需要一张表Q一条多态查询生成的SQL大概是这LQ?/p>
select id, payment_type, amount, currency, rtn, credit_card_type from payment
针对具体子类Q例如CashPaymentQ的查询生成的SQL是这LQ?/p>
select id, amount, currency from payment where payment_type=’CASH’
q样做的优点包括只有一张表、查询简单以及容易与其他表进行关联。第二个查询中不需要包含其他子cM的属性。所有这些特性让该策略的性能调优要比其他{略Ҏ得多。这U方法通常比较适合数据仓库pȝQ因为所有数据都在一张表里,不需要做表连接?/p>
主要的缺Ҏ个类层次中的所有属性都挤在一张大表里Q如果有很多子类Ҏ的属性,数据库中׃有太多字D늚取gؓnullQ这为当前基于行的数据库Q用基于列的DBMS的数据仓库处理这个会更好些)的SQL调优增加了难度。除非进行分区,否则唯一的数据表会成为热点,OLTPpȝ通常在这斚w都不太好?/p>
需?张表Q多态查询生成的SQL如下Q?/p>
select id, payment_type, amount, currency, rtn, credit_card type, case when c.payment_id is not null then 1 when ck.payment_id is not null then 2 when cc.payment_id is not null then 3 when p.id is not null then 0 end as clazz from payment p left join cash_payment c on p.id=c.payment_id left join cheque_payment ck on p.id=ck.payment_id left join credit_payment cc on p.id=cc.payment_id;
针对具体子类Q例如CashPaymentQ的查询生成的SQL是这LQ?/p>
select id, payment_type, amount, currency from payment p left join cash_payment c on p.id=c.payment_id;
优点包括数据表比较紧凑(没有不需要的可空字段Q,数据跨三个子cȝ表进行分区,Ҏ使用类的表与其他表q行兌。紧凑的数据表可以针对基于行的数据库做存储块优化Q让SQL执行得更好。数据分区增加了数据修改的ƈ发性(除了类Q没有热点)QOLTPpȝ通常会更好些?/p>
同样的,W二个查询不需要包含其他子cȝ属性?/p>
~点是在所有策略中它用的表和表连接最多,SQL语句E显复杂Q看看Hibernate动态鉴别器的长CASE子句Q。相比单张表Q数据库要花更多旉调优数据表连接,数据仓库在用该{略旉常不太理想?/p>
因ؓ不能跨超cd子类的字D|建立复合索引Q如果需要按q些列进行查询,性能会受影响。Q何子cL据的修改都涉及两张表Q超cȝ表和子类的表?/p>
涉及三张或更多的表,多态查询生成的SQL是这LQ?/p>
select p.id, p.amount, p.currency, p.rtn, p. credit_card_type, p.clazz from (select id, amount, currency, null as rtn,null as credit_card type, 1 as clazz from cash_payment union all select id, amount, null as currency, rtn,null as credit_card type, 2 as clazz from cheque_payment union all select id, amount, null as currency, null as rtn,credit_card type, 3 as clazz from credit_payment) p;
针对具体子类Q例如CashPaymentQ的查询生成的SQL是这LQ?/p>
select id, payment_type, amount, currency from cash_payment;
优点和上面的“每个子类一张表”{略怼。因c通常是抽象的Q所以具体的三张表是必须的[开头处说的3张或更多的表是必ȝ]QQ何子cȝ数据修改只涉及一张表Q运行v来更快?/p>
~点是SQLQfrom子句和union all子查询)太复杂。但是大多数数据库对此类SQL的调优都很好?/p>
如果一个类惛_Payment类兌Q数据库无法使用引用完整性(referential integrityQ来实现它;必须使用触发器来实现它。这Ҏ据库性能有些影响?/p>
只需要三张表。对于Payment的多态查询生成三条独立的SQL语句Q每个对应一个子cRHibernate引擎通过Java反射扑ևPayment的所有三个子cR?/p>
具体子类的查询只生成该子cȝSQL。这些SQL语句都很单,q里׃再阐qC?/p>
它的优点和上节类|紧凑数据表、跨三个具体子类的数据分Z及对子类L数据的修攚w只涉及一张表?/p>
~点是用三条独立的SQL语句代替了一条联合SQLQ这会带来更多网lIO。Java反射也需要时间。假讑֦果你有一大堆领域对象Q你从最上层的Objectc进行隐式选择查询Q那该需要多长时间啊Q?/p>
Ҏ你的映射{略制定合理的选择查询q易事Q这需要你仔细调优业务需求,Z特定的数据场景制定合理的设计决策?/p>
以下是一些徏议:
范例4
下面是一个交易描q应用程序的部分领域cdQ?/p>
开始时Q项目只有GasDeal和少数用P它?#8220;每个cdơ一张表”?/p>
OilDeal和ElectricityDeal是后期生更多业务需求后加入的。没有改变映策略。但是ElectricityDeal有太多自q属性,因此有很多电相关的可I字D加入了Deal表。因为用户量也在增长Q数据修改变得越来越慢?/p>
重新设计时我们用了两张单独的表Q分别针Ҏ/油和늛关的属性。新的映合了“每个cdơ一张表”?#8220;每个子类一张表”。我们还重新设计了查询,以便允许针对具体交易子类q行选择Q消除不必要的列和表q接?/p>
Z4.1?/strong>中对业务规则和设计的调优Q你得到了一个用POJO来表C的领域对象的类图。我们徏议:
范例5
我们有一个名为ElectricityDeals的核心POJO用于描述늚交易。从业务角度来看Q它有很多many-to-one兌Q例如和Portfolio、Strategy和Trader{的兌。因为引用数据十分稳定,它们被缓存在前端Q能Z其ID属性快速定位到它们?/p>
Z有好的加载性能QElectricityDeal只映元数据Q即那些引用POJO的值类型ID属性,因ؓ在需要时Q可以在前端通过portfolioKey从缓存中快速查找PortfolioQ?/p>
<property name="portfolioKey" column="PORTFOLIO_ID" type="integer"/>q种隐式兌避免了数据库表连接和额外的字D选择Q降低了数据传输的大?/p>
׃创徏物理数据库连接非常耗时Q你应该始终使用q接池,而且应该始终使用生U连接池而非Hibernate内置的基本连接池法?/p>
通常会ؓHibernate提供一个有q接池功能的数据源。Apache DBCP的BasicDataSource[13]是一个流行的开源生产数据源。大多数数据库厂商也实现了自q兼容JDBC 3.0的连接池。D例来_你也可以使用Oracle ReaApplication Cluster [15]提供的JDBCq接?sup>[14]以获得连接的负蝲均衡和失败{UR?/p>
不用多说Q你在网上能扑ֈ很多关于q接池调优的技术,因此我们只讨论那些大多数q接池所共有的通用调优参数Q?/p>
短数据库事务对Q何高性能、高可扩展性的应用E序来说都是必不可少的。你使用表示对话h的会话来处理单个工作单元Q以此来处理事务?/p>
考虑到工作单元的范围和事务边界的划分Q有3中模式:
你还应该注意以下几点?nbsp;
范例6
我们的应用程序有多个在大多数情况下只和数据库“A”打交道的服务层方法;它们偶尔也会从数据库“B”中获取只L据。因为数据库“B”只提供只L据,我们对这些方法在q两个数据库上仍然用本C务?/p>
服务层上有一个方法设计在两个数据库上执行数据变更。以下是伪代码:
//Make sure a local transaction on database A exists @Transactional (readOnly=false, propagation=Propagation.REQUIRED) public void saveIsoBids() { //it participates in the above annotated local transaction insertBidsInDatabaseA(); //it runs in its own local transaction on database B insertBidRequestsInDatabaseB(); //must be the last operation因ؓinsertBidRequestsInDatabaseB()是saveIsoBids ()中的最后一个方法,所以只有下面的场景会造成数据不一_
在saveIsoBids()执行q回Ӟ数据?#8220;A”的本C务提交失败?/p>
但是Q就saveIsoBids()使用JTAQ在两阶D|交(2PCQ的W二个提交阶D失败的时候,你还是会到数据不一致。因此如果你能处理好上述的数据不一致性,而且不想Z一个或数几个Ҏ引入JTA的复杂性,你应该用本C务?/p>
Q未完待l)