1.row_number
2.rank
3.dense_rank
4.ntile
下面分別介紹一下這四個排名函數(shù)的功能及用法。在介紹之前假設有一個t_table表,表結(jié)構與表中的數(shù)據(jù)如圖1所示:
圖1
其中field1字段的類型是int,field2字段的類型是varchar
一、row_number
row_number函數(shù)的用途是非常廣泛,這個函數(shù)的功能是為查詢出來的每一行記錄生成一個序號。row_number函數(shù)的用法如下面的SQL語句所示:
selectrow_number()over(orderbyfield1)asrow_number,*fromt_table
上面的SQL語句的查詢結(jié)果如圖2所示。
圖2
其中row_number列是由row_number函數(shù)生成的序號列。在使用row_number函數(shù)是要使用over子句選擇對某一列進行排序,然后才能生成序號。
實際上,row_number函數(shù)生成序號的基本原理是先使用over子句中的排序語句對記錄進行排序,然后按著這個順序生成序號。over子句中的order by子句與SQL語句中的order by子句沒有任何關系,這兩處的order by 可以完全不同,如下面的SQL語句所示:
selectrow_number()over(orderbyfield2desc)asrow_number,*fromt_tableorderbyfield1desc
上面的SQL語句的查詢結(jié)果如圖3所示。
圖3
我們可以使用row_number函數(shù)來實現(xiàn)查詢表中指定范圍的記錄,一般將其應用到Web應用程序的分頁功能上。下面的SQL語句可以查詢t_table表中第2條和第3條記錄:
witht_rowtable
as
(
selectrow_number()over(orderbyfield1)asrow_number,*fromt_table
)
select*fromt_rowtablewhererow_number>1androw_number<4orderbyfield1
上面的SQL語句的查詢結(jié)果如圖4所示。
圖4
上面的SQL語句使用了CTE,關于CTE的介紹將讀者參閱《SQL Server2005雜談(1):使用公用表表達式(CTE)簡化嵌套SQL》。
另外要注意的是,如果將row_number函數(shù)用于分頁處理,over子句中的order by 與排序記錄的order by 應相同,否則生成的序號可能不是有續(xù)的。
當然,不使用row_number函數(shù)也可以實現(xiàn)查詢指定范圍的記錄,就是比較麻煩。一般的方法是使用顛倒Top來實現(xiàn),例如,查詢t_table表中第2條和第3條記錄,可以先查出前3條記錄,然后將查詢出來的這三條記錄按倒序排序,再取前2條記錄,最后再將查出來的這2條記錄再按倒序排序,就是最終結(jié)果。SQL語句如下:
select*from(selecttop2*from(selecttop3*fromt_tableorderbyfield1)aorderbyfield1desc)borderbyfield1
上面的SQL語句查詢出來的結(jié)果如圖5所示。
圖5
這個查詢結(jié)果除了沒有序號列row_number,其他的與圖4所示的查詢結(jié)果完全一樣。
二、rank
rank函數(shù)考慮到了over子句中排序字段值相同的情況,為了更容易說明問題,在t_table表中再加一條記錄,如圖6所示。
圖6
在圖6所示的記錄中后三條記錄的field1字段值是相同的。如果使用rank函數(shù)來生成序號,這3條記錄的序號是相同的,而第4條記錄會根據(jù)當前的記錄數(shù)生成序號,后面的記錄依此類推,也就是說,在這個例子中,第4條記錄的序號是4,而不是2。rank函數(shù)的使用方法與row_number函數(shù)完全相同,SQL語句如下:
selectrank()over(orderbyfield1),*fromt_tableorderbyfield1
上面的SQL語句的查詢結(jié)果如圖7所示。
圖7
三、dense_rank
dense_rank函數(shù)的功能與rank函數(shù)類似,只是在生成序號時是連續(xù)的,而rank函數(shù)生成的序號有可能不連續(xù)。如上面的例子中如果使用dense_rank函數(shù),第4條記錄的序號應該是2,而不是4。如下面的SQL語句所示:
selectdense_rank()over(orderbyfield1),*fromt_tableorderbyfield1
上面的SQL語句的查詢結(jié)果如圖8所示。
圖8
讀者可以比較圖7和圖8所示的查詢結(jié)果有什么不同
四、ntile
ntile函數(shù)可以對序號進行分組處理。這就相當于將查詢出來的記錄集放到指定長度的數(shù)組中,每一個數(shù)組元素存放一定數(shù)量的記錄。ntile函數(shù)為每條記錄生成的序號就是這條記錄所有的數(shù)組元素的索引(從1開始)。也可以將每一個分配記錄的數(shù)組元素稱為“桶”。ntile函數(shù)有一個參數(shù),用來指定桶數(shù)。下面的SQL語句使用ntile函數(shù)對t_table表進行了裝桶處理:
selectntile(4)over(orderbyfield1)asbucket,*fromt_table
上面的SQL語句的查詢結(jié)果如圖9所示。
圖9
由于t_table表的記錄總數(shù)是6,而上面的SQL語句中的ntile函數(shù)指定了桶數(shù)為4。
也許有的讀者會問這么一個問題,SQL Server2005怎么來決定某一桶應該放多少記錄呢?可能t_table表中的記錄數(shù)有些少,那么我們假設t_table表中有59條記錄,而桶數(shù)是5,那么每一桶應放多少記錄呢?
實際上通過兩個約定就可以產(chǎn)生一個算法來決定哪一個桶應放多少記錄,這兩個約定如下:
1.編號小的桶放的記錄不能小于編號大的桶。也就是說,第1捅中的記錄數(shù)只能大于等于第2桶及以后的各桶中的記錄。
2.所有桶中的記錄要么都相同,要么從某一個記錄較少的桶開始后面所有捅的記錄數(shù)都與該桶的記錄數(shù)相同。也就是說,如果有個桶,前三桶的記錄數(shù)都是10,而第4捅的記錄數(shù)是6,那么第5桶和第6桶的記錄數(shù)也必須是6。
根據(jù)上面的兩個約定,可以得出如下的算法:
//mod表示取余,div表示取整
if(記錄總數(shù)mod桶數(shù)==0)
{
recordCount=記錄總數(shù)div桶數(shù);
將每桶的記錄數(shù)都設為recordCount
}
else
{
recordCount1=記錄總數(shù)div桶數(shù)+1;
intn=1; // n表示桶中記錄數(shù)為recordCount1的最大桶數(shù)
m=recordCount1*n;
while(((記錄總數(shù)-m) mod (桶數(shù)- n)) !=0)
{
n++;
m=recordCount1*n;
}
recordCount2=(記錄總數(shù)-m)div (桶數(shù)-n);
將前n個桶的記錄數(shù)設為recordCount1
將n+1個至后面所有桶的記錄數(shù)設為recordCount2
}
根據(jù)上面的算法,如果記錄總數(shù)為59,桶數(shù)為5,則前4個桶的記錄數(shù)都是12,最后一個桶的記錄數(shù)是11。
如果記錄總數(shù)為53,桶數(shù)為5,則前3個桶的記錄數(shù)為11,后2個桶的記錄數(shù)為10。
就拿本例來說,記錄總數(shù)為6,桶數(shù)為4,則會算出recordCount1的值為2,在結(jié)束while循環(huán)后,會算出recordCount2的值是1,因此,前2個桶的記錄是2,后2個桶的記錄是1。