JAVA—咖啡館

          ——歡迎訪問rogerfan的博客,常來《JAVA——咖啡館》坐坐,喝杯濃香的咖啡,彼此探討一下JAVA技術(shù),交流工作經(jīng)驗,分享JAVA帶來的快樂!本網(wǎng)站部分轉(zhuǎn)載文章,如果有版權(quán)問題請與我聯(lián)系。

          BlogJava 首頁 新隨筆 聯(lián)系 聚合 管理
            447 Posts :: 145 Stories :: 368 Comments :: 0 Trackbacks

          分析函數(shù)2(Rank, Dense_rank, row_number)

           

          目錄
          ===============================================
          1.使用rownum為記錄排名
          2.使用分析函數(shù)來為記錄排名
          3.使用分析函數(shù)為記錄進行分組排名

          一、使用rownum為記錄排名:

          在前面一篇《Oracle開發(fā)專題之:分析函數(shù)》,我們認(rèn)識了分析函數(shù)的基本應(yīng)用,現(xiàn)在我們再來考慮下面幾個問題:

          對所有客戶按訂單總額進行排名
          按區(qū)域和客戶訂單總額進行排名
          找出訂單總額排名前13位的客戶
          找出訂單總額最高、最低的客戶
          找出訂單總額排名前25%的客戶

          按照前面第一篇文章的思路,我們只能做到對各個分組的數(shù)據(jù)進行統(tǒng)計,如果需要排名的話那么只需要簡單地加上rownum不就行了嗎?事實情況是否如此想象般簡單,我們來實踐一下。

          1】測試環(huán)境:

          SQL> desc user_order;
           Name                                      Null?    Type
           ----------------------------------------- -------- ----------------------------
           REGION_ID                                          NUMBER(2)
           CUSTOMER_ID                                  NUMBER(2)
           CUSTOMER_SALES                          NUMBER


          2】測試數(shù)據(jù):

          SQL> select * from user_order order by customer_sales;

           REGION_ID CUSTOMER_ID CUSTOMER_SALES
          ---------- ----------- --------------
                   5           1              151162
                  10          29             903383
                   6           7              971585
                  10          28            986964
                   9          21           1020541
                   9          22           1036146
                   8          16           1068467
                   6           8            1141638
                   5           3            1161286
                   5           5            1169926
                   8          19           1174421
                   7          12           1182275
                   7          11           1190421
                   6          10           1196748
                   6           9            1208959
                  10          30          1216858
                   5             2                1224992
                     9             24              1224992
                     9             23              1224992
                     
          8
                    18           1253840
                   7          15           1255591
                   7          13           1310434
                  10          27          1322747
                   8          20           1413722
                   6           6            1788836
                  10          26          1808949
                   5           4            1878275
                   7          14           1929774
                   8          17           1944281
                   9          25           2232703

          30 rows selected.


          注意這里有3條記錄的訂單總額是一樣的。假如我們現(xiàn)在需要篩選排名前12位的客戶,如果使用rownum會有什么樣的后果呢?

          SQL> select rownum, t.*
            2    from (select * 
            3            from user_order
            4           order by customer_sales desc) t
            5   where rownum <= 12
            6   order by customer_sales desc;

              ROWNUM  REGION_ID CUSTOMER_ID CUSTOMER_SALES
          ---------- ---------- ----------- --------------
                   1          9                 25        2232703
                   2          8                 17        1944281
                   3          7                 14        1929774
                   4          5                   4        1878275
                   5         10                26        1808949
                   6          6                   6        1788836
                   7          8                 20        1413722
                   8         10                27        1322747
                   9          7                13        1310434
                  10          7               15        1255591
                  11          8               18        1253840
                    12             5                     2          1224992

          12 rows selected.


          很明顯假如只是簡單地按rownum進行排序的話,我們漏掉了另外兩條記錄(參考上面的結(jié)果)

          二、使用分析函數(shù)來為記錄排名:

          針對上面的情況,Oracle8i開始就提供了3個分析函數(shù):randdense_rankrow_number來解決諸如此類的問題,下面我們來看看這3個分析函數(shù)的作用以及彼此之間的區(qū)別:

          Rank
          Dense_rankRow_number函數(shù)為每條記錄產(chǎn)生一個從1開始至N的自然數(shù),N的值可能小于等于記錄的總數(shù)。這3個函數(shù)的唯一區(qū)別在于當(dāng)碰到相同數(shù)據(jù)時的排名策略。

          ROW_NUMBER

          Row_number函數(shù)返回一個唯一的值,當(dāng)碰到相同數(shù)據(jù)時,排名按照記錄集中記錄的順序依次遞增。 

          DENSE_RANK
          Dense_rank函數(shù)返回一個唯一的值,除非當(dāng)碰到相同數(shù)據(jù)時,此時所有相同數(shù)據(jù)的排名都是一樣的。 

          RANK
          Rank函數(shù)返回一個唯一的值,除非遇到相同的數(shù)據(jù)時,此時所有相同數(shù)據(jù)的排名是一樣的,同時會在最后一條相同記錄和下一條不同記錄的排名之間空出排名。

          這樣的介紹有點難懂,我們還是通過實例來說明吧,下面的例子演示了3個不同函數(shù)在遇到相同數(shù)據(jù)時不同排名策略:

          SQL> select region_id, customer_id, sum(customer_sales) total,
            2         rank() over(order by sum(customer_sales) desc) rank,
            3         dense_rank() over(order by sum(customer_sales) desc) dense_rank,
            4         row_number() over(order by sum(customer_sales) desc) row_number
            5    from user_order
            6   group by region_id, customer_id;

           REGION_ID CUSTOMER_ID      TOTAL       RANK DENSE_RANK ROW_NUMBER
          ---------- ----------- ---------- ---------- ---------- ----------
                      
                   8          18                1253840         11         11         11
                   5           2                 1224992         12         12         12
                   9          23                1224992         12         12         13
                   9          24                1224992         12         12         14
                  10          30               1216858         15           13            15
              

          30 rows selected.


          請注意上面的綠色高亮部分,這里生動的演示了3種不同的排名策略:

          對于第一條相同的記錄,3種函數(shù)的排名都是一樣的:12

          當(dāng)出現(xiàn)第二條相同的記錄時,RankDense_rank依然給出同樣的排名12;而row_number則順延遞增為13,依次類推至第三條相同的記錄

          當(dāng)排名進行到下一條不同的記錄時,可以看到Rank函數(shù)在1215之間空出了13,14的排名,因為這2個排名實際上已經(jīng)被第二、三條相同的記錄占了。而Dense_rank則順序遞增。row_number函數(shù)也是順序遞增

          比較上面3種不同的策略,我們在選擇的時候就要根據(jù)客戶的需求來定奪了:

          假如客戶就只需要指定數(shù)目的記錄,那么采用row_number是最簡單的,但有漏掉的記錄的危險

          假如客戶需要所有達(dá)到排名水平的記錄,那么采用rankdense_rank是不錯的選擇。至于選擇哪一種則看客戶的需要,選擇dense_rank或得到最大的記錄

          三、使用分析函數(shù)為記錄進行分組排名:

          上面的排名是按訂單總額來進行排列的,現(xiàn)在跟進一步:假如是為各個地區(qū)的訂單總額進行排名呢?這意味著又多了一次分組操作:對記錄按地區(qū)分組然后進行排名。幸虧Oracle也提供了這樣的支持,我們所要做的僅僅是在over函數(shù)中order by的前面增加一個分組子句:partition by region_id

          SQL> select region_id, customer_id, 
                         sum(customer_sales) total,
            2         rank() over(partition by region_id
                                  order by sum(customer_sales) desc) rank,
            3         dense_rank() over(partition by region_id
                                  order by sum(customer_sales) desc) dense_rank,
            4         row_number() over(partition by region_id
                                  order by sum(customer_sales) desc) row_number

            5    from user_order
            6   group by region_id, customer_id;

           REGION_ID CUSTOMER_ID      TOTAL       RANK DENSE_RANK ROW_NUMBER
          ---------- ----------- ---------- ---------- ---------- ----------
                   5           4                1878275          1          1          1
                   5           2                1224992          2          2          2
                   5           5                1169926          3          3          3
                   6           6                1788836          1          1          1
                   6           9                1208959          2          2          2
                   6          10               1196748          3          3          3       
            

          30 rows selected.


          現(xiàn)在我們看到的排名將是基于各個地區(qū)的,而非所有區(qū)域的了!Partition by 子句在排列函數(shù)中的作用是將一個結(jié)果集劃分成幾個部分,這樣排列函數(shù)就能夠應(yīng)用于這各個子集。

          前面我們提到的5個問題已經(jīng)解決了2個了(1,2),剩下的3個問題(Top/Bottom NFirst/Last, NTile)會在下一篇講解。
          posted on 2016-02-26 13:01 rogerfan 閱讀(325) 評論(0)  編輯  收藏 所屬分類: 【數(shù)據(jù)庫】
          主站蜘蛛池模板: 清丰县| 襄垣县| 泸州市| 进贤县| 深泽县| 佳木斯市| 尉犁县| 建宁县| 独山县| 盱眙县| 龙陵县| 黔西县| 革吉县| 麻江县| 尉氏县| 昭通市| 慈利县| 平和县| 额济纳旗| 新河县| 灯塔市| 乌海市| 阿鲁科尔沁旗| 什邡市| 上虞市| 南和县| 惠州市| 东光县| 新干县| 甘泉县| 乌拉特后旗| 乐东| 苏州市| 泸州市| 墨竹工卡县| 镇宁| 杭锦后旗| 吉隆县| 临泽县| 玉门市| 靖州|