走在架構(gòu)師的大道上 Jack.Wang's home

          Java, C++, linux c, C#.net 技術(shù),軟件架構(gòu),領(lǐng)域建模,IT 項(xiàng)目管理 Dict.CN 在線詞典, 英語(yǔ)學(xué)習(xí), 在線翻譯

          BlogJava 首頁(yè) 新隨筆 聯(lián)系 聚合 管理
            195 Posts :: 3 Stories :: 728 Comments :: 0 Trackbacks
          附加一 SQL+PL/SQL 學(xué)習(xí)資料(很好的基礎(chǔ)文檔(個(gè)人珍藏版))/Files/Jack2007/Sqlplsql.pdf
                                                                                           /Files/Jack2007/sqlandplsql.pdf


          Oracle SQL的優(yōu)化規(guī)則:
          • 盡量少用IN操作符,基本上所有的IN操作符都可以用EXISTS代替
                  用IN寫(xiě)出來(lái)的SQL的優(yōu)點(diǎn)是比較容易寫(xiě)及清晰易懂,但是用IN的SQL性能總是比較低的,從ORACLE執(zhí)行的步驟來(lái)分析用IN的SQL與不用IN的SQL有以下區(qū)別:
                 ORACLE 試圖將其轉(zhuǎn)換成多個(gè)表的連接,如果轉(zhuǎn)換不成功則先執(zhí)行IN里面的子查詢(xún),再查詢(xún)外層的表記錄,如果轉(zhuǎn)換成功則直接采用多個(gè)表的連接方式查詢(xún)。由此可見(jiàn)用 IN的SQL至少多了一個(gè)轉(zhuǎn)換的過(guò)程。一般的SQL都可以轉(zhuǎn)換成功,但對(duì)于含有分組統(tǒng)計(jì)等方面的SQL就不能轉(zhuǎn)換了。

                  Oracle在執(zhí)行IN子查詢(xún)時(shí),首先執(zhí)行子查詢(xún),將查詢(xún)結(jié)果放入臨時(shí)表再執(zhí)行主查詢(xún)。而EXIST則是首先檢查主查詢(xún),然后運(yùn)行子查詢(xún)直到找到第一個(gè)匹配項(xiàng)。NOT EXISTS比NOT IN效率稍高。但具體在選擇IN或EXIST操作時(shí),要根據(jù)主子表數(shù)據(jù)量大小來(lái)具體考慮。

                  推薦方案:在業(yè)務(wù)密集的SQL當(dāng)中盡量不采用IN操作符。
          不用NOT IN操作符,可以用NOT EXISTS或者外連接+替代
                  此操作是強(qiáng)列推薦不使用的,因?yàn)樗荒軕?yīng)用表的索引。

                  推薦方案:用NOT EXISTS 或(外連接+判斷為空)方案代替
          • 不用“<>”或者“!=”操作符。對(duì)不等于操作符的處理會(huì)造成全表掃描,可以用“<” or “>”代替
                  不等于操作符是永遠(yuǎn)不會(huì)用到索引的,因此對(duì)它的處理只會(huì)產(chǎn)生全表掃描。

                  推薦方案:用其它相同功能的操作運(yùn)算代替,如:
                  1)a<>0 改為 a>0 or a<0
                  2)a<>’’ 改為 a>’’
          • Where子句中出現(xiàn)IS NULL或者IS NOT NULL時(shí),Oracle會(huì)停止使用索引而執(zhí)行全表掃描??梢钥紤]在設(shè)計(jì)表時(shí),對(duì)索引列設(shè)置為NOT NULL。這樣就可以用其他操作來(lái)取代判斷NULL的操作
                  IS NULL 或IS NOT NULL操作(判斷字段是否為空)
                  判斷字段是否為空一般是不會(huì)應(yīng)用索引的,因?yàn)锽樹(shù)索引是不索引空值的。

                  推薦方案:
                  用其它相同功能的操作運(yùn)算代替,如:
                  1)a is not null 改為 a>0 或a>’’等。
                  2)不允許字段為空,而用一個(gè)缺省值代替空值,如業(yè)擴(kuò)申請(qǐng)中狀態(tài)字段不允許為空,缺省為申請(qǐng)。
                 3) 建立位圖索引(有分區(qū)的表不能建,位圖索引比較難控制,如字段值太多索引會(huì)使性能下降,多人更新操作會(huì)增加數(shù)據(jù)塊鎖的現(xiàn)象)
          •  當(dāng)通配符“%”或者“_”作為查詢(xún)字符串的第一個(gè)字符時(shí),索引不會(huì)被使用
          • 對(duì)于有連接的列“||”,最后一個(gè)連接列索引會(huì)無(wú)效。盡量避免連接,可以分開(kāi)連接或者使用不作用在列上的函數(shù)替代。
          • 如果索引不是基于函數(shù)的,那么當(dāng)在Where子句中對(duì)索引列使用函數(shù)時(shí),索引不再起作用。
          • Where子句中避免在索引列上使用計(jì)算,否則將導(dǎo)致索引失效而進(jìn)行全表掃描。
          • 對(duì)數(shù)據(jù)類(lèi)型不同的列進(jìn)行比較時(shí),會(huì)使索引失效。
          • > 及 < 操作符(大于或小于操作符)
                 大于或小于操作符一般情況下是不用調(diào)整的,因?yàn)樗兴饕蜁?huì)采用索引查找,但有的情況下可以對(duì)它進(jìn)行優(yōu)化,如一個(gè)表有100萬(wàn)記錄,一個(gè)數(shù)值型字段A, 30萬(wàn)記錄的A=0,30萬(wàn)記錄的A=1,39萬(wàn)記錄的A=2,1萬(wàn)記錄的A=3。那么執(zhí)行A>2與A>=3的效果就有很大的區(qū)別了,因?yàn)?A>2時(shí)ORACLE會(huì)先找出為2的記錄索引再進(jìn)行比較,而A>=3時(shí)ORACLE則直接找到=3的記錄索引。

                 推薦方案:用“>=”替代“>”。
          • UNION操作符
                 UNION在進(jìn)行表鏈接后會(huì)篩選掉重復(fù)的記錄,所以在表鏈接后會(huì)對(duì)所產(chǎn)生的結(jié)果集進(jìn)行排序運(yùn)算,刪除重復(fù)的記錄再返回結(jié)果。實(shí)際大部分應(yīng)用中是不會(huì)產(chǎn)生重復(fù)的記錄,最常見(jiàn)的是過(guò)程表與歷史表UNION。如:

              select * from gc_dfys
              union
              select * from ls_jg_dfys

              這個(gè)SQL在運(yùn)行時(shí)先取出兩個(gè)表的結(jié)果,再用排序空間進(jìn)行排序刪除重復(fù)的記錄,最后返回結(jié)果集,如果表數(shù)據(jù)量大的話可能會(huì)導(dǎo)致用磁盤(pán)進(jìn)行排序。

              推薦方案:采用UNION ALL操作符替代UNION,因?yàn)閁NION ALL操作只是簡(jiǎn)單的將兩個(gè)結(jié)果合并后就返回。

              select * from gc_dfys
              union all
              select * from ls_jg_dfys
          • LIKE操作符
                  LIKE 操作符可以應(yīng)用通配符查詢(xún),里面的通配符組合可能達(dá)到幾乎是任意的查詢(xún),但是如果用得不好則會(huì)產(chǎn)生性能上的問(wèn)題,如LIKE ‘%5400%’ 這種查詢(xún)不會(huì)引用索引,而LIKE ‘X5400%’則會(huì)引用范圍索引。一個(gè)實(shí)際例子:用YW_YHJBQK表中營(yíng)業(yè)編號(hào)后面的戶(hù)標(biāo)識(shí)號(hào)可來(lái)查詢(xún)營(yíng)業(yè)編號(hào) YY_BH LIKE ‘%5400%’ 這個(gè)條件會(huì)產(chǎn)生全表掃描,如果改成YY_BH LIKE ’X5400%’ OR YY_BH LIKE ’B5400%’ 則會(huì)利用YY_BH的索引進(jìn)行兩個(gè)范圍的查詢(xún),性能肯定大大提高。
          • SQL書(shū)寫(xiě)的影響(共享SQL語(yǔ)句可以提高操作效率)
              同一功能同一性能不同寫(xiě)法SQL的影響

              如一個(gè)SQL在A程序員寫(xiě)的為
              Select * from zl_yhjbqk

              B程序員寫(xiě)的為
              Select * from dlyx.zl_yhjbqk(帶表所有者的前綴)

              C程序員寫(xiě)的為
              Select * from DLYX.ZLYHJBQK(大寫(xiě)表名)

              D程序員寫(xiě)的為
              Select *  from DLYX.ZLYHJBQK(中間多了空格)

               以上四個(gè)SQL在ORACLE分析整理之后產(chǎn)生的結(jié)果及執(zhí)行的時(shí)間是一樣的,但是從ORACLE共享內(nèi)存SGA的原理,可以得出ORACLE對(duì)每個(gè)SQL 都會(huì)對(duì)其進(jìn)行一次分析,并且占用共享內(nèi)存,如果將SQL的字符串及格式寫(xiě)得完全相同則ORACLE只會(huì)分析一次,共享內(nèi)存也只會(huì)留下一次的分析結(jié)果,這不僅可以減少分析SQL的時(shí)間,而且可以減少共享內(nèi)存重復(fù)的信息,ORACLE也可以準(zhǔn)確統(tǒng)計(jì)SQL的執(zhí)行頻率。

              推薦方案:不同區(qū)域出現(xiàn)的相同的Sql語(yǔ)句,要保證查詢(xún)字符完全相同,以利用SGA共享池,防止相同的Sql語(yǔ)句被多次分析。
          • WHERE后面的條件順序影響
                 Oracle從下到上處理Where子句中多個(gè)查詢(xún)條件,所以表連接語(yǔ)句應(yīng)寫(xiě)在其他Where條件前,可以過(guò)濾掉最大數(shù)量記錄的條件必須寫(xiě)在Where子句的末尾。
                
                 WHERE子句后面的條件順序?qū)Υ髷?shù)據(jù)量表的查詢(xún)會(huì)產(chǎn)生直接的影響,如

              Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1

              Select * from zl_yhjbqk where xh_bz=1  and dy_dj = '1KV以下'

              以上兩個(gè)SQL中dy_dj(電壓等級(jí))及xh_bz(銷(xiāo)戶(hù)標(biāo)志)兩個(gè)字段都沒(méi)進(jìn)行索引,所以執(zhí)行的時(shí)候都是全表掃描,第一條SQL的dy_dj = '1KV以下'條件在記錄集內(nèi)比率為99%,而xh_bz=1的比率只為0.5%,在進(jìn)行第一條SQL的時(shí)候99%條記錄都進(jìn)行dy_dj及xh_bz的比較,而在進(jìn)行第二條SQL的時(shí)候0.5%條記錄都進(jìn)行dy_dj及xh_bz的比較,以此可以得出第二條SQL的CPU占用率明顯比第一條低。
          • 查詢(xún)表順序的影響
                 Oracle從右到左處理From子句中的表名,所以在From子句中包含多個(gè)表的情況下,將記錄最少的表放在最后。(只在采用RBO優(yōu)化時(shí)有效)

                 在FROM后面的表中的列表順序會(huì)對(duì)SQL執(zhí)行性能影響,在沒(méi)有索引及ORACLE沒(méi)有對(duì)表進(jìn)行統(tǒng)計(jì)分析的情況下ORACLE會(huì)按表出現(xiàn)的順序進(jìn)行鏈接,由此因?yàn)楸淼捻樞虿粚?duì)會(huì)產(chǎn)生十分耗服務(wù)器資源的數(shù)據(jù)交叉。(注:如果對(duì)表進(jìn)行了統(tǒng)計(jì)分析, ORACLE會(huì)自動(dòng)先進(jìn)小表的鏈接,再進(jìn)行大表的鏈接)。
          • Order By語(yǔ)句中的非索引列會(huì)降低性能,可以通過(guò)添加索引的方式處理。嚴(yán)格控制在Order By語(yǔ)句中使用表達(dá)式
          • 當(dāng)在Sql語(yǔ)句中連接多個(gè)表時(shí),使用表的別名,并將之作為每列的前綴。這樣可以減少解析時(shí)間
          • 多利用內(nèi)部函數(shù)提高Sql效率
          •  SQL語(yǔ)句索引的利用
            • 對(duì)操作符的優(yōu)化(見(jiàn)前面)
            • 對(duì)條件字段的一些優(yōu)化
              • 采用函數(shù)處理的字段不能利用索引
                    如:
                  substr(hbs_bh,1,4)=’5400’,優(yōu)化處理:hbs_bh like ‘5400%’

                  trunc(sk_rq)=trunc(sysdate), 優(yōu)化處理:sk_rq>=trunc(sysdate) and sk_rq<trunc(sysdate+1)
              • 進(jìn)行了顯式或隱式的運(yùn)算的字段不能進(jìn)行索引
                    如:

                  ss_df+20>50,優(yōu)化處理:ss_df>30

                  ‘X’||hbs_bh>’X5400021452’,優(yōu)化處理:hbs_bh>’5400021542’

                  sk_rq+5=sysdate,優(yōu)化處理:sk_rq=sysdate-5

                  hbs_bh=5401002554,優(yōu)化處理:hbs_bh=’ 5401002554’,注:此條件對(duì)hbs_bh 進(jìn)行隱式的to_number轉(zhuǎn)換,因?yàn)閔bs_bh字段是字符型。
              • 條件內(nèi)包括了多個(gè)本表的字段運(yùn)算時(shí)不能進(jìn)行索引
                    ys_df>cx_df,無(wú)法進(jìn)行優(yōu)化

                    qc_bh||kh_bh=’5400250000’,優(yōu)化處理:qc_bh=’5400’ and kh_bh=’250000’


              可能引起全表掃描的操作
          • 在索引列上使用NOT或者“<>”
          • 對(duì)索引列使用函數(shù)或者計(jì)算
          • NOT IN操作
          • 通配符位于查詢(xún)字符串的第一個(gè)字符
          • IS NULL或者IS NOT NULL
          • 多列索引,但它的第一個(gè)列并沒(méi)有被Where子句引用

                 ORACLE在SQL執(zhí)行分析方面已經(jīng)比較成熟,如果分析執(zhí)行的路徑不對(duì)首先應(yīng)在數(shù)據(jù)庫(kù)結(jié)構(gòu)(主要是索引)、服務(wù)器當(dāng)前性能(共享內(nèi)存、磁盤(pán)文件碎片)、數(shù)據(jù)庫(kù)對(duì)象(表、索引)統(tǒng)計(jì)信息是否正確這幾方面分析。


          轉(zhuǎn)載聲明:http://aofengblog.blog.163.com/blog/static/631702120083222117768/



          本博客為學(xué)習(xí)交流用,凡未注明引用的均為本人作品,轉(zhuǎn)載請(qǐng)注明出處,如有版權(quán)問(wèn)題請(qǐng)及時(shí)通知。由于博客時(shí)間倉(cāng)促,錯(cuò)誤之處敬請(qǐng)諒解,有任何意見(jiàn)可給我留言,愿共同學(xué)習(xí)進(jìn)步。
          posted on 2008-06-30 19:01 Jack.Wang 閱讀(12959) 評(píng)論(8)  編輯  收藏 所屬分類(lèi): 開(kāi)發(fā)技術(shù)

          Feedback

          # re: Oracle SQL 優(yōu)化 2008-06-30 21:45 隔葉黃鶯
          這個(gè)很實(shí)用,但是對(duì)于一般的開(kāi)發(fā)人員寫(xiě) SQL 語(yǔ)句最初都是為了意義上的好理解,只有發(fā)現(xiàn)性能很明顯不足時(shí)才有可能介入專(zhuān)職DBA來(lái)檢查。

          開(kāi)發(fā)人員掌握這些基本的 Oralce SQL 優(yōu)化是很有必要的,OK,我也從原文轉(zhuǎn)載一下。  回復(fù)  更多評(píng)論
            

          # re: Oracle SQL 優(yōu)化 2008-07-01 19:55 藍(lán)劍
          確實(shí)很實(shí)用!  回復(fù)  更多評(píng)論
            

          # re: Oracle SQL 優(yōu)化 2008-07-03 08:52 龐永慶
          你好,我們是出版公司,公司現(xiàn)在正先出版一本SQL優(yōu)化的書(shū),如果有興趣可以和我聯(lián)系。
          books_522008@yahoo.com.cn
          MSN:pyq_19852008@hotmail.com
          QQ:878 298 915 注明SQL  回復(fù)  更多評(píng)論
            

          # 關(guān)于”WHERE后面的條件順序影響“這一段,是不是有問(wèn)題? 2010-07-14 14:36 yangzhj
          原文:
          WHERE后面的條件順序影響
          Oracle從下到上處理Where子句中多個(gè)查詢(xún)條件,所以表連接語(yǔ)句應(yīng)寫(xiě)在其他Where條件前,可以過(guò)濾掉最大數(shù)量記錄的條件必須寫(xiě)在Where子句的末尾。
          WHERE子句后面的條件順序?qū)Υ髷?shù)據(jù)量表的查詢(xún)會(huì)產(chǎn)生直接的影響,如
          Select * from zl_yhjbqk where dy_dj = '1KV以下' and xh_bz=1
          Select * from zl_yhjbqk where xh_bz=1 and dy_dj = '1KV以下'
          以上兩個(gè)SQL中dy_dj(電壓等級(jí))及xh_bz(銷(xiāo)戶(hù)標(biāo)志)兩個(gè)字段都沒(méi)進(jìn)行索引,所以執(zhí)行的時(shí)候都是全表掃描,第一條SQL的dy_dj = '1KV以下'條件在記錄集內(nèi)比率為99%,而xh_bz=1的比率只為0.5%,在進(jìn)行第一條SQL的時(shí)候99%條記錄都進(jìn)行dy_dj及xh_bz的比較,而在進(jìn)行第二條SQL的時(shí)候0.5%條記錄都進(jìn)行dy_dj及xh_bz的比較,以此可以得出第二條SQL的CPU占用率明顯比第一條低。

          “可以過(guò)濾掉最大數(shù)量記錄的條件必須寫(xiě)在Where子句的末尾”
          而作者舉的例子中,顯然第一條SQL更符合這個(gè)條件,
          但得出的結(jié)果是:“以此可以得出第二條SQL的CPU占用率明顯比第一條低。

            回復(fù)  更多評(píng)論
            

          # re: Oracle SQL 優(yōu)化[未登錄](méi) 2011-08-09 11:43 1
          @yangzhj
          做個(gè)簡(jiǎn)單的計(jì)算就可以肯定這有問(wèn)題

          假設(shè)表A有n條記錄,非索引謂詞a,b,c.過(guò)濾率分別為1%, 30% ,90%,
          按照樓主的計(jì)算方式則:
          1. 先用a條件過(guò)來(lái),則為全表掃描 io簡(jiǎn)單認(rèn)為: n
          2. 再用b: 則為 0.01n
          3. 在用c: 則為 0.01*0.3n

          最后io為 n*0.01n*0.3n=O(n^3)

          如果不考慮條件順序,全表掃描然后對(duì)3個(gè)條件做一次匹配 則為O(n)

          很明顯下面的方式效率高很多。

          不過(guò)我where 條件順序還是有影響的,就算全表掃描然后對(duì)3個(gè)條件做一次匹配因?yàn)橛衎ool表達(dá)式短路效益也可以減少比較次數(shù)。

            回復(fù)  更多評(píng)論
            

          # re: Oracle SQL 優(yōu)化 2012-11-21 17:44 guf
          不錯(cuò)不錯(cuò),肯定是筆誤,寫(xiě)錯(cuò)了。  回復(fù)  更多評(píng)論
            

          # re: Oracle SQL 優(yōu)化 2013-08-17 09:33 kestrelley
          # re: Oracle SQL 優(yōu)化[未登錄](méi) 2011-08-09 11:43 1
          @yangzhj
          做個(gè)簡(jiǎn)單的計(jì)算就可以肯定這有問(wèn)題
          ...
          ————
          某人思考邏輯有誤?
          ----
          假設(shè)10000個(gè)記錄,則按樓主:
          a條件作用^10000,則結(jié)果100 (=10000* 0.01)
          b條件作用^100,則結(jié)果30(=100*0.3)
          c條件作用^30,則結(jié)果27(=30* 0.9)
          合計(jì)計(jì)算量: a*10000 + b*100 + c*30,并非 O(n^3)

          而顯然一次全表掃描,計(jì)算量=(a+b+c)*10000
          ————
          哪個(gè)快呢?

            回復(fù)  更多評(píng)論
            

          # re: Oracle SQL 優(yōu)化 2013-11-18 19:18 yimeng
          @yangzhj
          確實(shí)第一條 性能更優(yōu)  回復(fù)  更多評(píng)論
            

          主站蜘蛛池模板: 博白县| 栖霞市| 凤台县| 临潭县| 满洲里市| 石家庄市| 九寨沟县| 九江县| 万州区| 怀柔区| 上饶市| 许昌县| 阳朔县| 竹山县| 岳阳市| 上饶县| 上饶市| 徐水县| 乌海市| 昭苏县| 安乡县| 舞阳县| 星座| 绥德县| 仪征市| 无极县| 新化县| 佛学| 德安县| 玛多县| 奉新县| 石景山区| 西华县| 白河县| 静海县| 长白| 东阳市| 长葛市| 当阳市| 新密市| 即墨市|