【IT168 服務器學院】在數據庫表中,使用索引可以大大提高查詢速度。? 假如我們創建了一個testIndex表:
CREATE TABLE testIndex(i_testID INT NOT NULL,vc_Name VARCHAR(16) NOT NULL);
??? 我們隨機向里面插入了1000條記錄,其中有一條
i_testID vc_Name
555 erquan
??? 在查找vc_Name="erquan"的記錄
SELECT * FROM testIndex WHERE vc_Name='erquan';
時,如果在vc_Name上已經建立了索引,MySql無須任何掃描,即準確可找到該記錄!相反,MySql會掃描所有記錄,即要查詢1000次啊~~可以索引將查詢速度提高100倍。
??? 一、索引分單列索引和組合索引
單列索引:即一個索引只包含單個列,一個表可以有多個單列索引,但這不是組合索引。
組合索引:即一個索包含多個列。
??? 二、介紹一下索引的類型
1.普通索引。
??? 這是最基本的索引,它沒有任何限制。它有以下幾種創建方式:
(1)創建索引:CREATE INDEX indexName ON tableName(tableColumns(length));如果是CHAR,VARCHAR類型,length可以小于字段實際長度;如果是BLOB 和 TEXT 類型,必須指定length,下同。
(2)修改表結構:ALTER tableName ADD INDEX [indexName] ON (tableColumns(length))
(3)創建表的時候直接指定:CREATE TABLE tableName ( [...], INDEX [indexName] (tableColumns(length)) ;
2.唯一索引。
??? 它與前面的"普通索引"類似,不同的就是:索引列的值必須唯一,但允許有空值。如果是組合索引,則列值的組合必須唯一。它有以下幾種創建方式:
(1)創建索引:CREATE UNIQUE INDEX indexName ON tableName(tableColumns(length))
(2)修改表結構:ALTER tableName ADD UNIQUE [indexName] ON (tableColumns(length))
(3)創建表的時候直接指定:CREATE TABLE tableName ( [...], UNIQUE [indexName] (tableColumns(length));
3.主鍵索引
??? 它是一種特殊的唯一索引,不允許有空值。一般是在建表的時候同時創建主鍵索引:CREATE TABLE testIndex(i_testID INT NOT NULL AUTO_INCREMENT,vc_Name VARCHAR(16) NOT NULL,PRIMARY KEY(i_testID)); 當然也可以用ALTER命令。
記住:一個表只能有一個主鍵。
4.全文索引
MySQL從3.23.23版開始支持全文索引和全文檢索。這里不作討論,呵呵~~
刪除索引的語法:DROP INDEX index_name ON tableName
??? 三、單列索引和組合索引
??? 為了形象地對比兩者,再建一個表:
CREATE TABLE myIndex ( i_testID INT NOT NULL AUTO_INCREMENT, vc_Name VARCHAR(50) NOT NULL, vc_City VARCHAR(50) NOT NULL, i_Age INT NOT NULL, i_SchoolID INT NOT NULL, PRIMARY KEY (i_testID) );
?? 在這10000條記錄里面7上8下地分布了5條vc_Name="erquan"的記錄,只不過city,age,school的組合各不相同。
來看這條T-SQL:
SELECT i_testID FROM myIndex WHERE vc_Name='erquan' AND vc_City='鄭州' AND i_Age=25;
??? 首先考慮建單列索引:
??? 在vc_Name列上建立了索引。執行T-SQL時,MYSQL很快將目標鎖定在了vc_Name=erquan的5條記錄上,取出來放到一中間結果集。在這個結果集里,先排除掉vc_City不等于"鄭州"的記錄,再排除i_Age不等于25的記錄,最后篩選出唯一的符合條件的記錄。????? 雖然在vc_Name上建立了索引,查詢時MYSQL不用掃描整張表,效率有所提高,但離我們的要求還有一定的距離。同樣的,在vc_City和i_Age分別建立的單列索引的效率相似。
??? 為了進一步榨取MySQL的效率,就要考慮建立組合索引。就是將vc_Name,vc_City,i_Age建到一個索引里:
ALTER TABLE myIndex ADD INDEX name_city_age (vc_Name(10),vc_City,i_Age);--注意了,建表時,vc_Name長度為50,這里為什么用10呢?因為一般情況下名字的長度不會超過10,這樣會加速索引查詢速度,還會減少索引文件的大小,提高INSERT的更新速度。
??? 執行T-SQL時,MySQL無須掃描任何記錄就到找到唯一的記錄!!
??? 肯定有人要問了,如果分別在vc_Name,vc_City,i_Age上建立單列索引,讓該表有3個單列索引,查詢時和上述的組合索引效率一樣吧?嘿嘿,大不一樣,遠遠低于我們的組合索引~~雖然此時有了三個索引,但MySQL只能用到其中的那個它認為似乎是最有效率的單列索引。
建立這樣的組合索引,其實是相當于分別建立了
vc_Name,vc_City,i_Age
vc_Name,vc_City
vc_Name
??? 這樣的三個組合索引!為什么沒有vc_City,i_Age等這樣的組合索引呢?這是因為mysql組合索引"最左前綴"的結果。簡單的理解就是只從最左面的開始組合。并不是只要包含這三列的查詢都會用到該組合索引,下面的幾個T-SQL會用到:
SELECT * FROM myIndex WHREE vc_Name="erquan" AND vc_City="鄭州"
SELECT * FROM myIndex WHREE vc_Name="erquan"
而下面幾個則不會用到:
SELECT * FROM myIndex WHREE i_Age=20 AND vc_City="鄭州"
SELECT * FROM myIndex WHREE vc_City="鄭州"
??? 四、使用索引
??? 到此你應該會建立、使用索引了吧?但什么情況下需要建立索引呢?一般來說,在WHERE和JOIN中出現的列需要建立索引,但也不完全如此,因為MySQL只對 <,<=,=,>,>=,BETWEEN,IN,以及某些時候的LIKE(后面有說明)才會使用索引。
SELECT t.vc_Name FROM testIndex t LEFT JOIN myIndex m ON t.vc_Name=m.vc_Name WHERE m.i_Age=20 AND m.vc_City='鄭州' 時,有對myIndex表的vc_City和i_Age建立索引的需要,由于testIndex表的vc_Name開出現在了JOIN子句中,也有對它建立索引的必要。
??? 剛才提到了,只有某些時候的LIKE才需建立索引?是的。因為在以通配符 % 和 _ 開頭作查詢時,MySQL不會使用索引,如
SELECT * FROM myIndex WHERE vc_Name like'erquan%'
會使用索引,而
SELECT * FROM myIndex WHEREt vc_Name like'%erquan'
就不會使用索引了。
??? 五、索引的不足之處
??? 上面說了那么多索引的好話,它真的有像傳說中那么優秀么?當然會有缺點了。
1.雖然索引大大提高了查詢速度,同時卻會降低更新表的速度,如對表進行INSERT、UPDATE和DELETE。因為更新表時,MySQL不僅要保存數據,還要保存一下索引文件
2.建立索引會占用磁盤空間的索引文件。一般情況這個問題不太嚴重,但如果你在一個大表上創建了多種組合索引,索引文件的會膨脹很快。
??? 篇尾:
??? 講了這么多,無非是想利用索引提高數據庫的執行效率。不過索引只是提高效率的一個因素。如果你的MySQL有大數據的表,就需要花時間研究建立最優秀的索引或優化查詢語句。