轉(zhuǎn)自:http://www.aygfsteel.com/chenpengyi/archive/2006/07/29/60679.html
我們?cè)谧鲆恍┎樵?xún)的時(shí)候總希望能避免數(shù)據(jù)庫(kù)引擎做全表掃描,因?yàn)槿頀呙钑r(shí)間長(zhǎng),而且其中大部分掃描對(duì)客戶(hù)端而言是沒(méi)有意義的。那么在 MySQL 中有那些方式是可以避免全表掃面的呢?除了我們大家很熟悉的通過(guò)使用索引列或分區(qū)等方式來(lái)進(jìn)行查詢(xún)的優(yōu)化之外還有那些呢?
前些天看了一個(gè)老外寫(xiě)的程序,在 MySQL 查詢(xún)中使用了很多 Limit 關(guān)鍵字,這就讓我很感興趣了,因?yàn)樵谖矣∠笾校?/span> Limit 關(guān)鍵字似乎更多被使用 MySQL 數(shù)據(jù)庫(kù)的程序員用來(lái)做查詢(xún)分頁(yè)(當(dāng)然這也是一種很好的查詢(xún)優(yōu)化),那在這里舉個(gè)例子,假設(shè)我們需要一個(gè)分頁(yè)的查詢(xún) ,Oracle中一般來(lái)說(shuō)都是用以下 SQL 句子實(shí)現(xiàn):
SELECT * FROM
( SELECT a1.*, rownum rownum_
FROM testtable a1
WHERE rownum > 20)
WHERE rownum_ <= 1000
這個(gè)語(yǔ)句就能查詢(xún)到 testtable 表中的 20 到 1000 記錄,而且還需要嵌套查詢(xún),效率不會(huì)太高,看看 MySQL 的實(shí)現(xiàn):
SELECT * FROM testtable a1 limit 20,980;
這樣就能返回 testtable 表中的 21 條到( 20 + 980 =) 1000 條的記錄。
實(shí)現(xiàn)語(yǔ)法確實(shí)簡(jiǎn)單,但如果要說(shuō)這里兩個(gè) SQL 語(yǔ)句的效率,那就很難做比較了,因?yàn)樵?/span> MySQL 中 Limit 選項(xiàng)有多種不同的解釋方式,不同方式下的速度差異是很大的,因此我們不能從這語(yǔ)句的簡(jiǎn)潔程度就說(shuō)誰(shuí)的效率高。
不過(guò)對(duì)程序員來(lái)說(shuō),夠簡(jiǎn)單就好,因?yàn)榫S護(hù)成本低,呵呵。
下面講講這個(gè) Limit 的語(yǔ)法吧:
SELECT ……. --Select 語(yǔ)句的其他參數(shù)
[LIMIT {[offset,] row_count | row_count OFFSET offset}]
這里 offset 是偏移量(這個(gè)偏移量的起始地址是 0 ,而不是 1 ,這點(diǎn)很容易搞錯(cuò)的)顧名思義就是離開(kāi)起始點(diǎn)的位置,而 row-count 也是很簡(jiǎn)單的,就是返回的記錄的數(shù)量限制。
Eg. SELECT * FROM testtable a limit 10,20 where ….
這樣就能使結(jié)果返回 10 行以后(包括 10 行自身)的符合 where 條件的 20 條記錄。
那么如果沒(méi)有約束條件就返回 10 到 29 行的記錄。
那這跟避免全表掃描有什么關(guān)系呢? 下面是 MySQL 手冊(cè)對(duì) Limit 參數(shù)優(yōu)化掃描的一些說(shuō)明:
在一些情況中,當(dāng)你使用 LIMIT 選項(xiàng)而不是使用 HAVING 時(shí), MySQL 將以不同方式處理查詢(xún)。
l 如果你用 LIMIT 只選擇其中一部分行,當(dāng) MySQL 一般會(huì)做完整的表掃描時(shí),但在某些情況下會(huì)使用索引(跟 ipart 有關(guān))。
l 如果你將 LIMIT n 與 ORDER BY 同時(shí)使用,在 MySQL 找到了第一個(gè)符合條件的記錄后,將結(jié)束排序而不是排序整個(gè)表。
l 當(dāng) LIMIT n 和 DISTINCT 同時(shí)使用時(shí), MySQL 在找到一個(gè)記錄后將停止查詢(xún)。
l 某些情況下, GROUP BY 能通過(guò)順序讀取鍵 ( 或在鍵上做排序 ) 來(lái)解決,并然后計(jì)算摘要直到鍵值改變。在這種情況下, LIMIT n 將不計(jì)算任何不必要的 GROUP 。
l 當(dāng) MySQL 完成發(fā)送第 n 行到客戶(hù)端,它將放棄余下的查詢(xún)。
l 而 LIMIT 0 選項(xiàng)總是快速返回一個(gè)空記錄。這對(duì)檢查查詢(xún)并且得到結(jié)果列的列類(lèi)型是有用的。
l 臨時(shí)表的大小使用 LIMIT # 計(jì)算需要多少空間來(lái)解決查詢(xún)。
如果需要在查詢(xún)語(yǔ)句返回的列中包含一列表示該條記錄在整個(gè)結(jié)果集中的行號(hào), ISO SQL:2003 標(biāo)準(zhǔn)提出的方法是提供 ROW_NUMBER() / RANK() 函數(shù)。 Oracle 中可以使用標(biāo)準(zhǔn)方法(8i版本以上),也可以使用非標(biāo)準(zhǔn)的 ROWNUM ; MS SQL Server 則在 2005 版本中提供了 ROW_NUMBER() 函數(shù);但在 MySQL 中似乎還沒(méi)有這樣的系統(tǒng)自帶功能。雖然 LIMIT 可以很方便的對(duì)返回的結(jié)果集數(shù)量和位置進(jìn)行過(guò)濾,但過(guò)濾出來(lái)的記錄的行號(hào)卻沒(méi)辦法被 SELECT 到。據(jù)說(shuō) MySQL 是早就想增加這個(gè)功能了,但我是還沒(méi)找到。
解決方法是通過(guò)預(yù)定義用戶(hù)變量來(lái)實(shí)現(xiàn):
set @mycnt = 0;
select (@mycnt := @mycnt + 1) as ROWNUM , othercol from tblname order by othercol;
這樣查詢(xún)出來(lái)的結(jié)果集中 ROWNUM 就保存了行編號(hào)信息。這個(gè)行編號(hào)信息的某種用途在于當(dāng)你需要根據(jù)需要對(duì)數(shù)據(jù)按照某種規(guī)則排序并取出排序之后的某一行數(shù)據(jù),并且希望知道這行數(shù)據(jù)在之前排序中的位置時(shí)就用得著了。比如:
set @mycnt = 0;
select * from (
select (@mycnt := @mycnt + 1) as ROWNUM , othercol
from tblname order by othercol
) as A where othercol=OneKeyID;
當(dāng)然你也可以通過(guò)創(chuàng)建臨時(shí)表的方法把查詢(xún)結(jié)果寫(xiě)到某個(gè)擁有 auto_increment 字段的臨時(shí)表中再做查詢(xún),但考慮到臨時(shí)表在 MySQL master / slave 模式下可能產(chǎn)生的問(wèn)題,用這樣臨時(shí)用戶(hù)定義變量的方式來(lái)計(jì)算查詢(xún)結(jié)果集每一行對(duì)應(yīng)的行號(hào)還是更為簡(jiǎn)潔 -- 除非你愿意在 PHP 或其他語(yǔ)言腳本中對(duì)返回的整個(gè)結(jié)果集再作處理。