用一個例子詳細說明單列索引與組合索引的區別及索引使用中的一些細節
建一個表:
CREATE TABLE myIndex (
i_testID INT NOT NULL AUTO_INCREMENT,
vc_Name VARCHAR(50) NOT NULL,
vc_City VARCHAR(50) NOT NULL,
i_Age INT NOT NULL,
i_SchoolID INT NOT NULL,
PRIMARY KEY (i_testID)
);
假設這個表中有10000條記錄,其中很分散地分布了5條vc_Name="erquan"的記錄,只不過city,age,school的組合各不相同。
來看這條T-SQL:
SELECT i_testID FROM myIndex WHERE vc_Name='erquan' AND vc_City='beijing' AND i_Age=25;
首先考慮建單列索引:
在vc_Name列上建立了索引。執行T-SQL時,MYSQL很快將目標鎖定在了vc_Name=erquan的5條記錄上,取出來放到一中間 結果集。在這個結果集里,先排除掉vc_City不等于"beijing"的記錄,再排除i_Age不等于25的記錄,最后篩選出唯一的符合條件的記錄。
雖然在vc_Name上建立了索引,查詢時MYSQL不用掃描整張表,效率有所提高,但離我們的要求還有一定的距離。同樣的,在vc_City和i_Age分別建立的單列索引的效率相似。
為了進一步榨取MySQL的效率,就要考慮建立組合索引。就是將vc_Name,vc_City,i_Age建到一個索引里:
ALTER TABLE myIndex ADD INDEX name_city_age (vc_Name(10),vc_City,i_Age);--注意了,建表時,vc_Name長度為50,這里為什么用10呢?因為一般情況下名字的長 度不會超過10,這樣會加速索引查詢速度,還會減少索引文件的大小,提高INSERT的更新速度。
執行T-SQL時,MySQL無須掃描任何記錄就到找到唯一的記錄!
肯定有人要問了,如果分別在vc_Name,vc_City,i_Age上建立單列索引,讓該表有3個單列索引,查詢時和上述的組合索引效率一樣 吧?嘿嘿,大不一樣,遠遠低于我們的組合索引~~雖然此時有了三個索引,但MySQL只能用到其中的那個它認為似乎是最有效率的單列索引。
建立這樣的組合索引,其實是相當于分別建立了
vc_Name,vc_City,i_Age
vc_Name,vc_City
vc_Name
這樣的三個組合索引為什么沒有vc_City,i_Age等這樣的組合索引的效率呢?這是因為mysql組合索引"最左前綴"的結果。簡單的理解就是只從最左面的開始組合。并不是只要包含這三列的查詢都會用到該組合索引,下面的幾個T-SQL會用到:
SELECT * FROM myIndex WHREE vc_Name="erquan" AND vc_City="beijing"
SELECT * FROM myIndex WHREE vc_Name="erquan"
而下面幾個則不會用到:
SELECT * FROM myIndex WHREE i_Age=20 AND vc_City="beijing"
SELECT * FROM myIndex WHREE vc_City="beijing"
但什么情況下需要建立索引呢?一般來說,在WHERE和JOIN中出現的列需要建立索引,但也不完全如此,因為MySQL只對 <,<=,=,>,>=,BETWEEN,IN,以及某些時候的LIKE才會使用索引。
SELECT t.vc_Name FROM testIndex t LEFT JOIN myIndex m ON t.vc_Name=m.vc_Name WHERE m.i_Age=20 AND m.vc_City='beijing' 時,有對myIndex表的vc_City和i_Age建立索引的需要,由于testIndex表的vc_Name開出現在了JOIN子句中,也有對它建立索引的必要。
剛才提到只有某些時候的LIKE才需建立索引?是的。因為在以通配符 % 和 _ 開頭作查詢時,MySQL不會使用索引,如
SELECT * FROM myIndex WHERE vc_Name like'erquan%'
會使用索引,而
SELECT * FROM myIndex WHEREt vc_Name like'%erquan'
就不會使用索引了。
posted @ 2007-09-22 23:19 擦肩而過 閱讀(307) | 評論 (0) | 編輯 收藏