qileilove

          blog已經轉移至github,大家請訪問 http://qaseven.github.io/

          MySQL數據庫性能優化之索引優化

          大家都知道索引對于數據訪問的性能有非常關鍵的作用,都知道索引可以提高數據訪問效率。

            為什么索引能提高數據訪問性能?他會不會有“副作用”?是不是索引創建越多,性能就越好?到底該如何設計索引,才能最大限度的發揮其效能?

            這篇文章主要是帶著上面這幾個問題來做一個簡要的分析,同時排除了業務場景所帶來的特殊性,請不要糾結業務場景的影響。

            這是 MySQL數據庫性能優化專題 系列的第三篇文章:MySQL 數據庫性能優化之索引優化

            系列的第二篇文章:MySQL 數據庫性能優化之表結構優化

            系列的第一篇文章:MySQL 數據庫性能優化之緩存參數優化

            索引為什么能提高數據訪問性能?

            很多人只知道索引能夠提高數據庫的性能,但并不是特別了解其原理,其實我們可以用一個生活中的示例來理解。

             我們讓一位不太懂計算機的朋友去圖書館確認一本叫做《MySQL性能調優與架構設計》的書是否在藏,這樣對他說:“請幫我借一本計算機類的數據庫書籍, 是屬于 MySQL 數據庫范疇的,叫做《MySQL性能調優與架構設計》”。朋友會根據所屬類別,前往存放“計算機”書籍區域的書架,然后再尋找“數據庫”類存放位置,再找 到一堆講述“MySQL”的書籍,最后可能發現目標在藏(也可能已經借出不在書架上)。

            在這個過程中: “計算機”->“數據庫”->“MySQL”->“在藏”->《MySQL性能調優與架構設計》其實就是一個“根據索引查找數 據”的典型案例,“計算機”->“數據庫”->“MySQL”->“在藏” 就是朋友查找書籍的索引。

            假設沒有這個 索引,那查找這本書的過程會變成怎樣呢?朋友只能從圖書館入口一個書架一個書架的“遍歷”,直到找到《MySQL性能調優與架構設計》這本書為止。如果幸 運,可能在第一個書架就找到。但如果不幸呢,那就慘了,可能要將整個圖書館所有的書架都找一遍才能找到我們想要的這本書。

            注:這個例子 中的“索引”是記錄在朋友大腦中的,實際上,每個圖書館都會有一個非常全的實際存在的索引系統(大多位于入口顯眼處),由很多個貼上了明顯標簽的小抽屜構 成。這個索引系統中存放這非常齊全詳盡的索引數據,標識出我們需要查找的“目標”在某個區域的某個書架上。而且每當有新的書籍入庫,舊的書籍銷毀以及書記 信息修改,都需要對索引系統進行及時的修正。

            下面我們通過上面這個生活中的小示例,來分析一下索引,看看能的出哪些結論?

            索引有哪些“副作用”?

            圖書的變更(增,刪,改)都需要修訂索引,索引存在額外的維護成本

            查找翻閱索引系統需要消耗時間,索引存在額外的訪問成本

            這個索引系統需要一個地方來存放,索引存在額外的空間成本

            索引是不是越多越好?

            如果我們的這個圖書館只是一個進出中轉站,里面的新書進來后很快就會轉發去其他圖書館而從這個館藏中“清除”,那我們的索引就只會不斷的修改,而很少會被用來查找圖書

            所以,對于類似于這樣的存在非常大更新量的數據,索引的維護成本會非常高,如果其檢索需求很少,而且對檢索效率并沒有非常高的要求的時候,我們并不建議創建索引,或者是盡量減少索引。

           如果我們的書籍量少到只有幾本或者就只有一個書架,索引并不會帶來什么作用,甚至可能還會浪費一些查找索引所花費的時間。

            所以,對于數據量極小到通過索引檢索還不如直接遍歷來得快的數據,也并不適合使用索引。

            如果我們的圖書館只有一個10平方的面積,現在連放書架都已經非常擁擠,而且館藏還在不斷增加,我們還能考慮創建索引嗎?

            所以,當我們連存儲基礎數據的空間都捉襟見肘的時候,我們也應該盡量減少低效或者是去除索引。

            索引該如何設計才高效?

            如果我們僅僅只是這樣告訴對方的:“幫我確認一本數據庫類別的講述 MySQL 的叫做《MySQL性能調優與架構設計》的書是否在藏”,結果又會如何呢?朋友只能一個大類區域一個大類區域的去尋找“數據庫”類別,然后再找到 “MySQL”范疇,再看到我們所需是否在藏。由于我們少說了一個“計算機類”,朋友就必須到每一個大類去尋找。

            所以,我們應該盡量讓查找條件盡可能多的在索引中,盡可能通過索引完成所有過濾,回表只是取出額外的數據字段。

            如果我們是這樣說的:“幫我確認一本講述 MySQL 的數據庫范疇的計算機叢書,叫做《MySQL性能調優與架構設計》,看是否在藏”。如果這位朋友并不知道計算機是一個大類,也不知道數據庫屬于計算機大 類,那這位朋友就悲劇了。首先他得遍歷每個類別確認“MySQL”存在于哪些類別中,然后從包含 “MySQL” 書籍中再看有哪些是“數據庫”范疇的(有可能部分是講述PHP或者其他開發語言的),然后再排除非計算機類的(雖然可能并沒有必要),然后才能確認。

            所以,字段的順序對組合索引效率有至關重要的作用,過濾效果越好的字段需要更靠前。

            如果我們還有這樣一個需求(雖然基本不可能):“幫我將圖書館中所有的計算機圖書借來”。朋友如果通過索引來找,每次都到索引柜找到計算機書籍 所在的區域,然后從書架上搬下一格(假設只能以一格為單位從書架上取下,類比數據庫中以block/page為單位讀?。〕龅谝槐?,然后再從索引柜找 到計算機圖書所在區域,再搬下一格,取出一本… 如此往復直至取完所有的書。如果他不通過索引來找又會怎樣呢?他需要從地一個書架一直往后找,當找到計算機的書,搬下一格,取出所有計算機的書,再往后, 直至所有書架全部看一遍。在這個過程中,如果計算機類書籍較多,通過索引來取所花費的時間很可能要大于直接遍歷,因為不斷往復的索引翻閱所消耗的時間會非 常長。(延伸閱讀:這里有一篇以前寫的關于Oracle的文章,索引掃描還是全表掃描(Index Scan Or Full Table Scan))

            所以,當我們需要讀取的數據量占整個數據量的比例較大抑或者說索引的過濾效果并不是太好的時候,使用索引并不一定優于全表掃描。

            如果我們的朋友不知道“數據庫”這個類別可以屬于“計算機”這個大類,抑或者圖書館的索引系統中這兩個類別屬性并沒有關聯關系,又會怎樣呢?也 就是說,朋友得到的是2個獨立的索引,一個是告知“計算機”這個大類所在的區域,一個是“數據庫”這個小類所在的區域(很可能是多個區域),那么他只能二 者選其一來搜索我的需求。即使朋友可以分別通過2個索引檢索然后自己在腦中取交集再找,那這樣的效率實際過程中也會比較低下。

            所以,在實際使用過程中,一次數據訪問一般只能利用到1個索引,這一點在索引創建過程中一定要注意,不是說一條SQL語句中Where子句里面每個條件都有索引能對應上就可以了。

            看完這些分析,我想大家應該了解索引優化的一些基本思路了吧。

          posted on 2012-05-07 09:27 順其自然EVO 閱讀(164) 評論(0)  編輯  收藏 所屬分類: 數據庫

          <2012年5月>
          293012345
          6789101112
          13141516171819
          20212223242526
          272829303112
          3456789

          導航

          統計

          常用鏈接

          留言簿(55)

          隨筆分類

          隨筆檔案

          文章分類

          文章檔案

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 九江市| 离岛区| 阜平县| 芦山县| 咸宁市| 黄陵县| 商水县| 措美县| 内丘县| 荥阳市| 四会市| 舞阳县| 佛教| 宁化县| 平陆县| 龙泉市| 武乡县| 两当县| 镇巴县| 武胜县| 巨野县| 昔阳县| 仁寿县| 蒲江县| 渝北区| 浮山县| 鹤峰县| 志丹县| 乌审旗| 长丰县| 灌阳县| 区。| 泗阳县| 浏阳市| 罗江县| 凭祥市| 蓝田县| 汉源县| 林西县| 宽城| 普兰店市|