海鷗航際

          JAVA站
          posts - 11, comments - 53, trackbacks - 1, articles - 102

          導(dǎo)航

          <2025年7月>
          293012345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          常用鏈接

          留言簿(4)

          隨筆檔案

          文章分類

          文章檔案

          相冊(cè)

          搜索

          •  

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          Oracle專家調(diào)優(yōu)秘密

          前言

          在過去的十年中,Oracle已經(jīng)成為世界上最專業(yè)的數(shù)據(jù)庫之一。對(duì)于IT專家來說,就是要確保利用Oracle的強(qiáng)大特性來提高他們公司的生產(chǎn)力。最有效的方法之一是通過Oracle調(diào)優(yōu)。它有大量的調(diào)整參數(shù)和技術(shù)來改進(jìn)你的Oracle數(shù)據(jù)庫的性能。

          Oracle調(diào)優(yōu)是一個(gè)復(fù)雜的主題。關(guān)于調(diào)優(yōu)可以寫整整一本書,不過,為了改善Oracle數(shù)據(jù)庫的性能,有一些基本的概念是每個(gè)Oracle DBA都應(yīng)該遵從的。

          在這篇簡介中,我們將簡要地介紹以下的 Oracle 主題:

          -- 外部調(diào)整:我們應(yīng)該記住Oracle并不是單獨(dú)運(yùn)行的。因此我們將查看一下通過調(diào)整Oracle服務(wù)器以得到高的性能。
          -- Row re-sequencing以減少磁盤I/O:我們應(yīng)該懂得Oracle調(diào)優(yōu)最重要的目標(biāo)是減少I/O。
          -- Oracle SQL調(diào)整。Oracle SQL調(diào)整是Oracle調(diào)整中最重要的領(lǐng)域之一,只要通過一些簡單的SQL調(diào)優(yōu)規(guī)則就可以大幅度地提升SQL語句的性能,這是一點(diǎn)都不奇怪的。
          -- 調(diào)整Oracle排序:排序?qū)τ贠racle性能也是有很大影響的。
          -- 調(diào)整Oracle的競爭:表和索引的參數(shù)設(shè)置對(duì)于UPDATE和INSERT的性能有很大的影響。

          我們首先從調(diào)整Oracle外部的環(huán)境開始。如果內(nèi)存和CPU的資源不足的話,任何的Oracle調(diào)整都是沒有幫助的。

          外部的性能問題

          Oracle并不是單獨(dú)運(yùn)行的。Oracle數(shù)據(jù)庫的性能和外部的環(huán)境有很大的關(guān)系。這些外部的條件包括有:
            .CPU -- CPU 資源的不足令查詢變慢。當(dāng)查詢超過了Oracle服務(wù)器的CPU性能時(shí),你的數(shù)據(jù)庫性能就受到CPU的限制。
            .內(nèi)存 -- 可用于Oralce的內(nèi)存數(shù)量也會(huì)影響SQL的性能,特別是在數(shù)據(jù)緩沖和內(nèi)存排序方面。
            .網(wǎng)絡(luò) -- 大量的Net8通信令SQL的性能變慢。
          許多新手都錯(cuò)誤的認(rèn)為應(yīng)該首先調(diào)整Oracle數(shù)據(jù)庫,而不是先確認(rèn)外部資源是否足夠。實(shí)際上,如果外部環(huán)境出現(xiàn)瓶頸,再多的Oracle調(diào)整都是沒有幫助的。

          在檢查Oracle的外部環(huán)境時(shí),有兩個(gè)方面是需要注意的:
           1 、當(dāng)運(yùn)行隊(duì)列的數(shù)目超過服務(wù)器的CPU數(shù)量時(shí),服務(wù)器的性能就會(huì)受到CPU的限制。補(bǔ)救的方法是為服務(wù)器增加額外的CPU或者關(guān)閉需要很多處理資源的組件,例如 Oracle Parallel Query 。
           2 、內(nèi)存分頁。當(dāng)內(nèi)存分頁時(shí),內(nèi)存容量已經(jīng)不足,而內(nèi)存頁是與磁盤上的交換區(qū)進(jìn)行交互的。補(bǔ)救的方法是增加更多的內(nèi)存,減少Oracle SGA的大小,或者關(guān)閉Oracle的多線程服務(wù)器。

          可以使用各種標(biāo)準(zhǔn)的服務(wù)器工具來得到服務(wù)器的統(tǒng)計(jì)數(shù)據(jù),例如 vmstat,glance,top 和 sar 。 DBA的目標(biāo)是確保數(shù)據(jù)庫服務(wù)器擁有足夠的CPU和內(nèi)存資源來處理Oracle的請(qǐng)求。

          以下讓我們來看一下Oracle的row-resequencing是如何能夠極大地減少磁盤I/O的。

          Row-resequencing (行的重新排序)

          就象我們上面提到的,有經(jīng)驗(yàn)的Oracle DBA都知道I/O是響應(yīng)時(shí)間的最大組成部分。其中磁盤I/O特別厲害,因?yàn)楫?dāng)Oracle由磁盤上的一個(gè)數(shù)據(jù)文件得到一個(gè)數(shù)據(jù)塊時(shí),讀的進(jìn)程就必須等待物理I/O操作完成。磁盤操作要比數(shù)據(jù)緩沖慢10,000倍。因此,如果可以令I(lǐng)/O最小化,或者減少由于磁盤上的文件競爭而帶來的瓶頸,就可以大大地改善Oracle數(shù)據(jù)庫的性能。

          如果系統(tǒng)響應(yīng)很慢,通過減少磁盤I/O就可以有一個(gè)很快的改善。如果在一個(gè)事務(wù)中通過按一定的范圍搜索 primary-key索引來訪問表,那么重新以CTAS的方法組織表將是你減少I/O的首要策略。通過在物理上將行排序?yàn)楹蚿rimary-key索引一樣的順序,就可以加快獲得數(shù)據(jù)的速度。

          就象磁盤的負(fù)載平衡一樣,行的重新排序也是很簡單的,而且也很快。通過與其它的DBA管理技巧一起使用,就可以在高I/O的系統(tǒng)中大大地減少響應(yīng)的時(shí)間。

          在高容量的在線事務(wù)處理環(huán)境中(online transaction processing,OLTP),數(shù)據(jù)是由一個(gè)primary索引得到的,重新排序表格的行就可以令連續(xù)塊的順序和它們的primary索引一樣,這樣就可以在索引驅(qū)動(dòng)的表格查詢中,減少物理I/O并且改善響應(yīng)時(shí)間。這個(gè)技巧僅在應(yīng)用選擇多行的時(shí)候有用,或者在使用索引范圍搜索和應(yīng)用發(fā)出多個(gè)查詢來得到連續(xù)的key時(shí)有效。對(duì)于隨機(jī)的唯一primary-key(主鍵)的訪問將不會(huì)由行重新排序中得到好處。

          讓我們看一下它是如何工作的。考慮以下的一個(gè)SQL的查詢,它使用一個(gè)索引來得到100行:

              select salary from employee where last_name like 'B%'; 

          這個(gè)查詢將會(huì)使用last_name_index,搜索其中的每一行來得到目標(biāo)行。這個(gè)查詢將會(huì)至少使用100次物理磁盤的讀取,因?yàn)閑mployee的行存放在不同的數(shù)據(jù)塊中。

          不過,如果表中的行已經(jīng)重新排序?yàn)楹蚻ast_name_index的一樣,同樣的查詢又會(huì)怎樣處理呢?我們可以看到這個(gè)查詢只需要三次的磁盤I/O就讀完全部100個(gè)員工的資料(一次用作索引的讀取,兩次用作數(shù)據(jù)塊的讀取),減少了97次的塊讀取。

          重新排序帶來的性能改善的程度在于在你開始的時(shí)候行的亂序性如何,以及你需要由序列中訪問多少行。至于一個(gè)表中的行與索引的排序鍵的匹配程度,可以查看數(shù)據(jù)字典中的dba_indexes和dba_tables視圖得到。

          在dba_indexes的視圖中,查看clustering_factor列。如果clustering_factor的值和表中的塊數(shù)目大致一樣,那么你的表和索引的順序是一樣的。不過,如果clustering_factor的值接近表中的行數(shù)目,那就表明表格中的行和索引的順序是不一樣的。

          行重新排序的作用是不可以小看的。在需要進(jìn)行大范圍的索引搜索的大表中,行重新排序可以令查詢的性能提高三倍。

          一旦你已經(jīng)決定重新排序表中的行,你可以使用以下的工具之一來重新組織表格。

           . 使用Oracle的Create Table As Select(CTAS)語法來拷貝表格
           . Oracle9i自帶的表格重新組織工具

          以下,我們來看以下 SQL 語句的調(diào)優(yōu)。

          SQL調(diào)優(yōu)

          Oracle的SQL調(diào)優(yōu)是一個(gè)復(fù)雜的主題,甚至是需要整本書來介紹Oracle SQL調(diào)優(yōu)的細(xì)微差別。不過有一些基本的規(guī)則是每個(gè)Oracle DBA都需要跟從的,這些規(guī)則可以改善他們系統(tǒng)的性能。SQL調(diào)優(yōu)的目標(biāo)是簡單的:

           . 消除不必要的大表全表搜索:不必要的全表搜索導(dǎo)致大量不必要的I/O,從而拖慢整個(gè)數(shù)據(jù)庫的性能。調(diào)優(yōu)專家首先會(huì)根據(jù)查詢返回的行數(shù)目來評(píng)價(jià)SQL。在一個(gè)有序的表中,如果查詢返回少于40%的行,或者在一個(gè)無序的表中,返回少于7%的行,那么這個(gè)查詢都可以調(diào)整為使用一個(gè)索引來代替全表搜索。對(duì)于不必要的全表搜索來說,最常見的調(diào)優(yōu)方法是增加索引。可以在表中加入標(biāo)準(zhǔn)的B樹索引,也可以加入bitmap和基于函數(shù)的索引。要決定是否消除一個(gè)全表搜索,你可以仔細(xì)檢查索引搜索的I/O開銷和全表搜索的開銷,它們的開銷和數(shù)據(jù)塊的讀取和可能的并行執(zhí)行有關(guān),并將兩者作對(duì)比。在一些情況下,一些不必要的全表搜索的消除可以通過強(qiáng)制使用一個(gè)index來達(dá)到,只需要在SQL語句中加入一個(gè)索引的提示就可以了。

           . 在全表搜索是一個(gè)最快的訪問方法時(shí),將小表的全表搜索放到緩存中,調(diào)優(yōu)專家應(yīng)該確保有一個(gè)專門的數(shù)據(jù)緩沖用作行緩沖。在Oracle7中,你可以使用alter table xxx cache語句,在Oracle8或以上,小表可以被強(qiáng)制為放到KEEP池中緩沖。

           . 確保最優(yōu)的索引使用:對(duì)于改善查詢的速度,這是特別重要的。有時(shí)Oracle可以選擇多個(gè)索引來進(jìn)行查詢,調(diào)優(yōu)專家必須檢查每個(gè)索引并且確保Oracle使用正確的索引。它還包括bitmap和基于函數(shù)的索引的使用。

           . 確保最優(yōu)的JOIN操作:有些查詢使用NESTED LOOP join快一些,有些則是HASH join快一些,另外一些則是sort-merge join更快。

          這些規(guī)則看來簡單,不過它們占SQL調(diào)優(yōu)任務(wù)的90%,并且它們也無需完全懂得Oracle SQL的內(nèi)部運(yùn)作。以下我們來簡單概覽以下Oracle SQL的優(yōu)化。

          我們首先簡要查看 Oracle 的排序,并且看一看排序操作是如何影響性能的。

          調(diào)整 Oracle 的排序操作

          排序是SQL語法中一個(gè)小的方面,但很重要,在Oracle的調(diào)整中,它常常被忽略。當(dāng)使用create index、ORDER BY或者GROUP BY的語句時(shí),Oracle數(shù)據(jù)庫將會(huì)自動(dòng)執(zhí)行排序的操作。通常,在以下的情況下Oracle 會(huì)進(jìn)行排序的操作:
            使用Order by的SQL語句
            使用Group by的SQL語句
            在創(chuàng)建索引的時(shí)候
            進(jìn)行table join時(shí),由于現(xiàn)有索引的不足而導(dǎo)致SQL優(yōu)化器調(diào)用MERGE SORT

          當(dāng)與Oracle建立起一個(gè)session時(shí),在內(nèi)存中就會(huì)為該session分配一個(gè)私有的排序區(qū)域。如果該連接是一個(gè)專用的連接(dedicated connection),那么就會(huì)根據(jù)init.ora中sort_area_size參數(shù)的大小在內(nèi)存中分配一個(gè)Program Global Area(PGA)。如果連接是通過多線程服務(wù)器建立的,那么排序的空間就在large_pool中分配。不幸的是,對(duì)于所有的session,用做排序的內(nèi)存量都必須是一樣的,我們不能為需要更大排序的操作分配額外的排序區(qū)域。因此,設(shè)計(jì)者必須作出一個(gè)平衡,在分配足夠的排序區(qū)域以避免發(fā)生大的排序任務(wù)時(shí)出現(xiàn)磁盤排序(disk sorts)的同時(shí),對(duì)于那些并不需要進(jìn)行很大排序的任務(wù),就會(huì)出現(xiàn)一些浪費(fèi)。當(dāng)然,當(dāng)排序的空間需求超出了sort_area_size的大小時(shí),這時(shí)將會(huì)在TEMP表空間中分頁進(jìn)行磁盤排序。磁盤排序要比內(nèi)存排序大概慢14,000 倍。

          上面我們已經(jīng)提到,私有排序區(qū)域的大小是有init.ora中的sort_area_size參數(shù)決定的。每個(gè)排序所占用的大小由init.ora中的sort_area_retained_size參數(shù)決定。當(dāng)排序不能在分配的空間中完成時(shí),就會(huì)使用磁盤排序的方式,即在Oracle實(shí)例中的臨時(shí)表空間中進(jìn)行。

          磁盤排序的開銷是很大的,有幾個(gè)方面的原因。首先,和內(nèi)存排序相比較,它們特別慢;而且磁盤排序會(huì)消耗臨時(shí)表空間中的資源。Oracle還必須分配緩沖池塊來保持臨時(shí)表空間中的塊。無論什么時(shí)候,內(nèi)存排序都比磁盤排序好,磁盤排序?qū)?huì)令任務(wù)變慢,并且會(huì)影響Oracle實(shí)例的當(dāng)前任務(wù)的執(zhí)行。還有,過多的磁盤排序?qū)?huì)令free buffer waits的值變高,從而令其它任務(wù)的數(shù)據(jù)塊由緩沖中移走。

          接著,讓我們看一下Oracle的競爭,并且看一下表的存儲(chǔ)參數(shù)的設(shè)置是如何影響SQL UPDATE和INSERT語句的性能的。

          調(diào)整 Oracle 的競爭

          Oracle 的其中一個(gè)優(yōu)點(diǎn)時(shí)它可以管理每個(gè)表空間中的自由空間。Oracle負(fù)責(zé)處理表和索引的空間管理,這樣就可以讓我們無需懂得Oracle的表和索引的內(nèi)部運(yùn)作。不過,對(duì)于有經(jīng)驗(yàn)的Oracle調(diào)優(yōu)專家來說,他需要懂得Oracle是如何管理表的extent和空閑的數(shù)據(jù)塊。對(duì)于調(diào)整擁有高的insert或者update的系統(tǒng)來說,這是非常重要的。

          要精通對(duì)象的調(diào)整,你需要懂得freelists和freelist組的行為,它們和pctfree及pctused參數(shù)的值有關(guān)。這些知識(shí)對(duì)于企業(yè)資源計(jì)劃(ERP)的應(yīng)用是特別重要的,因?yàn)樵谶@些應(yīng)用中,不正確的表設(shè)置通常是DML語句執(zhí)行慢的原因。

          對(duì)于初學(xué)者來說,最常見的錯(cuò)誤是認(rèn)為默認(rèn)的Oracle參數(shù)對(duì)于所有的對(duì)象都是最佳的。除非磁盤的消耗不是一個(gè)問題,否則在設(shè)置表的pctfree和pctused參數(shù)時(shí),就必須考慮平均的行長和數(shù)據(jù)庫的塊大小,這樣空的塊才會(huì)被有效地放到freelists中。當(dāng)這些設(shè)置不正確時(shí),那些得到的freelists也是"dead"塊,因?yàn)樗鼈儧]有足夠的空間來存儲(chǔ)一行,這樣將會(huì)導(dǎo)致明顯的處理延遲。

          Freelists對(duì)于有效地重新使用Oracle表空間中的空間是很重要的,它和pctfree及pctused這兩個(gè)存儲(chǔ)參數(shù)的設(shè)置直接相關(guān)。通過將pctused設(shè)置為一個(gè)高的值,這時(shí)數(shù)據(jù)庫就會(huì)盡快地重新使用塊。不過,高性能和有效地重新使用表的塊是對(duì)立的。在調(diào)整Oracle的表格和索引時(shí),需要認(rèn)真考慮究竟需要高性能還是有效的空間重用,并且據(jù)此來設(shè)置表的參數(shù)。以下我們來看一下這些freelists是如何影響Oracle的性能的。

          當(dāng)有一個(gè)請(qǐng)求需要插入一行到表格中時(shí),Oracle就會(huì)到freelist中尋找一個(gè)有足夠的空間來容納一行的塊。你也許知道,freelist串是放在表格或者索引的第一個(gè)塊中,這個(gè)塊也被稱為段頭(segment header)。pctfree和pctused參數(shù)的唯一目的就是為了控制塊如何在freelists中進(jìn)出。雖然freelist link和unlink 是簡單的Oracle功能,不過設(shè)置freelist link(pctused)和unlink(pctfree)對(duì)Oracle的性能確實(shí)有影響。

          由DBA的基本知識(shí)知道,pctfree參數(shù)是控制freelist un-links的(即將塊由freelists中移除)。設(shè)置pctfree=10意味著每個(gè)塊都保留10%的空間用作行擴(kuò)展。pctused參數(shù)是控制freelist re-links的。設(shè)置pctused=40意味著只有在塊的使用低于40%時(shí)才會(huì)回到表格的freelists中。

          許多新手對(duì)于一個(gè)塊重新回到freelists后的處理都有些誤解。其實(shí),一旦由于一個(gè)刪除的操作而令塊被重新加入到freelist中,它將會(huì)一直保留在freelist中即使空間的使用超過了60% ,只有在到達(dá)pctfree時(shí)才會(huì)將數(shù)據(jù)塊由freelist中移走。

          表格和索引存儲(chǔ)參數(shù)設(shè)置的要求總結(jié)

          以下的一些規(guī)則是用來設(shè)置freelists,freelist groups,pctfree和pctused存儲(chǔ)參數(shù)的。你也知道,pctused和pctfree的值是可以很容易地通過alter table命令修改的,一個(gè)好的DBA應(yīng)該知道如何設(shè)置這些參數(shù)的最佳值。

          有效地使用空間和高性能之間是有矛盾的,而表格的存儲(chǔ)參數(shù)就是控制這個(gè)方面的矛盾:

           . 對(duì)于需要有效地重新使用空間,可以設(shè)置一個(gè)高的pctused值,不過副作用是需要額外的I/O 。一個(gè)高的pctused值意味著相對(duì)滿的塊都會(huì)放到freelist中。因此,這些塊在再次滿之前只可以接受幾行記錄,從而導(dǎo)致更多的I/O。

            . 追求高性能的話,可以將pctused設(shè)置為一個(gè)低的值,這意味著Oracle不會(huì)將數(shù)據(jù)塊放到freelists中直到它幾乎是空的。那么塊將可以在滿之前接收更多的行,因此可以減少插入操作的I/O。要記住Oracle擴(kuò)展新塊的性能要比重新使用現(xiàn)有的塊高。對(duì)于Oracle來說,擴(kuò)展一個(gè)表比管理freelists消耗更少的資源。

          讓我們來回顧一下設(shè)置對(duì)象存儲(chǔ)參數(shù)的一些常見規(guī)則:

            .經(jīng)常將pctused設(shè)置為可以接收一條新行。對(duì)于不能接受一行的free blocks對(duì)于我們來說是沒有用的。如果這樣做,將會(huì)令Oracle的性能變慢,因?yàn)镺racle將在擴(kuò)展表來得到一個(gè)空的塊之前,企圖讀取5個(gè)"dead"的free block。

            .表格中chained rows的出現(xiàn)意味著pctfree太低或者是db_block_size太少。在很多情況下,RAW和LONG RAW列都很巨大,以至超過了Oracle的最大塊的大小,這時(shí)chained rows是不可以避免的。

            .如果一個(gè)表有同時(shí)插入的SQL語句,那么它需要有同時(shí)刪除的語句。運(yùn)行單一個(gè)一個(gè)清除的工作將會(huì)把全部的空閑塊放到一個(gè)freelist中,而沒有其它包含有任何空閑塊的freelists出現(xiàn)。

            .freelist參數(shù)應(yīng)該設(shè)置為表格同時(shí)更新的最大值。例如,如果在任何時(shí)候,某個(gè)表最多有20個(gè)用戶執(zhí)行插入的操作,那么該表的參數(shù)應(yīng)該設(shè)置為freelists=20。

          應(yīng)記住的是freelist groups參數(shù)的值只是對(duì)于Oracle Parallel Server和Real Application Clusters才是有用的。對(duì)于這類Oracle,freelist groups應(yīng)該設(shè)置為訪問該表格的Oracle Parallel Server實(shí)例的數(shù)目。

          主站蜘蛛池模板: 东乌珠穆沁旗| 宿州市| 洞头县| 桂林市| 白水县| 怀宁县| 卢湾区| 桃江县| 房产| 抚顺市| 贺兰县| 清河县| 西平县| 青神县| 玉溪市| 长寿区| 大姚县| 和硕县| 天水市| 米泉市| 增城市| 九寨沟县| 营口市| 恩平市| 万安县| 伊吾县| 确山县| 探索| 利川市| 喀什市| 会昌县| 楚雄市| 鄂托克旗| 从化市| 门头沟区| 乐山市| 大洼县| 双辽市| 舒城县| 滕州市| 沈丘县|