[摘錄]ROLLUP和CUBE語句


          摘錄地址:http://xsb.itpub.net/post/419/29159

          2005-05-10 09:40 First Publish.
          Oracle的GROUP BY語句除了最基本的語法外,還支持ROLLUP和CUBE語句。如果是ROLLUP(A, B, C)的話,首先會對(A、B、C)進(jìn)行GROUP BY,然后對(A、B)進(jìn)行GROUP BY,然后是(A)進(jìn)行GROUP BY,最后對全表進(jìn)行GROUP BY操作。如果是GROUP BY CUBE(A, B, C),則首先會對(A、B、C)進(jìn)行GROUP BY,然后依次是(A、B),(A、C),(A),(B、C),(B),(C),最后對全表進(jìn)行GROUP BY操作。 grouping_id()可以美化效果:


          Oracle的GROUP BY語句除了最基本的語法外,還支持ROLLUP和CUBE語句。

          除本文內(nèi)容外,你還可參考:
          分析函數(shù)參考手冊:
          http://xsb.itpub.net/post/419/33028
          分析函數(shù)使用例子介紹:http://xsb.itpub.net/post/419/44634

          SQL> create table t as select * from dba_indexes;

          表已創(chuàng)建。

          SQL> select index_type, status, count(*) from t group by index_type, status;

          INDEX_TYPE STATUS COUNT(*)
          --------------------------- -------- ----------
          LOB VALID 51
          NORMAL N/A 25
          NORMAL VALID 479
          CLUSTER VALID 11

          下面來看看ROLLUP和CUBE語句的執(zhí)行結(jié)果。

          SQL> select index_type, status, count(*) from t group by rollup(index_type, status);

          INDEX_TYPE STATUS COUNT(*)
          --------------------------- -------- ----------
          LOB VALID 51
          LOB 51
          NORMAL N/A 25
          NORMAL VALID 479
          NORMAL 504
          CLUSTER VALID 11
          CLUSTER 11
          566

          已選擇8行。

          SQL> select index_type, status, count(*) from t group by cube(index_type, status);

          INDEX_TYPE STATUS COUNT(*)
          --------------------------- -------- ----------
          566
          N/A 25
          VALID 541
          LOB 51
          LOB VALID 51
          NORMAL 504
          NORMAL N/A 25
          NORMAL VALID 479
          CLUSTER 11
          CLUSTER VALID 11

          已選擇10行。

          查詢結(jié)果不是很一目了然,下面通過Oracle提供的函數(shù)GROUPING來整理一下查詢結(jié)果。

          SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*)
          2 from t group by rollup(index_type, status) order by 1, 2;

          G_IND G_ST INDEX_TYPE STATUS COUNT(*)
          ---------- ---------- --------------------------- -------- ----------
          0 0 LOB VALID 51
          0 0 NORMAL N/A 25
          0 0 NORMAL VALID 479
          0 0 CLUSTER VALID 11
          0 1 LOB 51
          0 1 NORMAL 504
          0 1 CLUSTER 11
          1 1 566

          已選擇8行。

          這個查詢結(jié)果就直觀多了,和不帶ROLLUP語句的GROUP BY相比,ROLLUP增加了對INDEX_TYPE的GROUP BY統(tǒng)計和對所有記錄的GROUP BY統(tǒng)計。

          也就是說,如果是ROLLUP(A, B, C)的話,首先會對(A、B、C)進(jìn)行GROUP BY,然后對(A、B)進(jìn)行GROUP BY,然后是(A)進(jìn)行GROUP BY,最后對全表進(jìn)行GROUP BY操作。

          下面看看CUBE語句。

          SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*)
          2 from t group by cube(index_type, status) order by 1, 2;

          G_IND G_ST INDEX_TYPE STATUS COUNT(*)
          ---------- ---------- --------------------------- -------- ----------
          0 0 LOB VALID 51
          0 0 NORMAL N/A 25
          0 0 NORMAL VALID 479
          0 0 CLUSTER VALID 11
          0 1 LOB 51
          0 1 NORMAL 504
          0 1 CLUSTER 11
          1 0 N/A 25
          1 0 VALID 541
          1 1 566

          已選擇10行。

          ROLLUP相比,CUBE又增加了對STATUS列的GROUP BY統(tǒng)計。

          如果是GROUP BY CUBE(A, B, C),則首先會對(A、B、C)進(jìn)行GROUP BY,然后依次是(A、B),(A、C),(A),(B、C),(B),(C),最后對全表進(jìn)行GROUP BY操作。

          除了使用GROUPING函數(shù),還可以使用GROUPING_ID來標(biāo)識GROUP BY結(jié)果。

          SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*)
          2 from t group by rollup(index_type, status) order by 1;

          G_IND INDEX_TYPE STATUS COUNT(*)
          ---------- --------------------------- -------- ----------
          0 LOB VALID 51
          0 NORMAL N/A 25
          0 NORMAL VALID 479
          0 CLUSTER VALID 11
          1 LOB 51
          1 NORMAL 504
          1 CLUSTER 11
          3 566

          已選擇8行。

          SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*)
          2 from t group by cube(index_type, status) order by 1;

          G_IND INDEX_TYPE STATUS COUNT(*)
          ---------- --------------------------- -------- ----------
          0 LOB VALID 51
          0 NORMAL N/A 25
          0 NORMAL VALID 479
          0 CLUSTER VALID 11
          1 LOB 51
          1 NORMAL 504
          1 CLUSTER 11
          2 N/A 25
          2 VALID 541
          3 566

          已選擇10行。

          grouping_id()可以美化效果:

          select DECODE(GROUPING_ID(C1), 1, '合計', C1) D1,
          DECODE(GROUPING_ID(C1, C2), 1, '小計', C2) D2,
          DECODE(GROUPING_ID(C1, C2, C1 + C2), 1, '小計', C1 + C2) D3,
          count(*),
          GROUPING_ID(C1, C2, C1 + C2, C1 + 1, C2 + 1),
          GROUPING_ID(C1)
          from T2
          group by rollup(C1, C2, C1 + C2, C1 + 1, C2 + 1);

          ===========================================================

          1.報表合計專用的Rollup函數(shù)

          銷售報表

          廣州 1 2000

          廣州 2 2500

          廣州 4500

          深圳 1 1000

          深圳 2 2000

          深圳 3000

          所有地區(qū) 7500

          以往的查詢SQL:

          Select area,month,sum(money) from SaleOrder group by area,month

          然后廣州,深圳的合計和所有地區(qū)合計都需要在程序里自行累計

          1.其實可以使用如下SQL:

          Select area,month,sum(total_sale) from SaleOrder group by rollup(area,month)

          就能產(chǎn)生和報表一模一樣的紀(jì)錄

          2.如果year不想累加,可以寫成

          Select year,month,area,sum(total_sale) from SaleOrder group by year, rollup(month,area)

          另外Oracle 9i還支持如下語法:

          Select year,month,area,sum(total_sale) from SaleOrder group by rollup((year,month),area)

          3.如果使用Cube(area,month)而不是RollUp(area,month),除了獲得每個地區(qū)的合計之外,還將獲得每個月份的合計,在報表最后顯示。

          4.Grouping讓合計列更好讀

          RollUp在顯示廣州合計時,月份列為NULL,但更好的做法應(yīng)該是顯示為"所有月份"

          Grouping就是用來判斷當(dāng)前Column是否是一個合計列,1yes,然后用Decode把它轉(zhuǎn)為"所有月份"

          Select Decode(Grouping(area),1,'所有地區(qū)',area) area, Decode(Grouping(month),1,'所有月份',month), sum(money) From SaleOrder Group by RollUp(area,month);

          2.對多級層次查詢的start with.....connect by

          比如人員組織,產(chǎn)品類別,Oracle提供了很經(jīng)典的方法

          SELECT LEVEL, name, emp_id,manager_emp_id FROM employee START WITH manager_emp_id is null CONNECT BY PRIOR emp_id = manager_emp_id;

          上面的語句demo了全部的應(yīng)用,start with指明從哪里開始遍歷樹,如果從根開始,那么它的manager應(yīng)該是Null,如果從某個職員開始,可以寫成emp_id='11'

          CONNECT BY 就是指明父子關(guān)系,注意PRIOR位置

          另外還有一個LEVEL,顯示節(jié)點(diǎn)的層次

          3.更多報表/分析決策功能

          3.1 分析功能的基本結(jié)構(gòu)

          分析功能() over( partion子句,order by子句,窗口子句)

          概念上很難講清楚,還是用例子說話比較好.

          3.2 Row_Number Rank, DENSE_Rank

          用于選出Top 3 sales這樣的報表

          當(dāng)兩個業(yè)務(wù)員可能有相同業(yè)績時,就要使用RankDense_Rank

          比如

          金額 RowNum Rank Dense_Rank

          張三 4000 1 1 1

          李四 3000 2 2 2

          錢五 2000 3 3 3

          孫六 2000 4 3 3

          丁七 1000 5 5 4

          這時,應(yīng)該把并列第三的錢五和孫六都選進(jìn)去,所以用Ranking功能比RowNumber保險.至于Desnse還是Ranking就看具體情況了。

          SELECT salesperson_id, SUM(tot_sales) sp_sales, RANK( ) OVER (ORDER BY SUM(tot_sales) DESC) sales_rank FROM orders GROUP BY salesperson_id

          3.3 NTILE 把紀(jì)錄平分成甲乙丙丁四等

          比如我想取得前25%的紀(jì)錄,或者把25%的紀(jì)錄當(dāng)作同一個level平等對待,把另25%當(dāng)作另一個Level平等對待

          SELECT cust_nbr, SUM(tot_sales) cust_sales, NTILE(4) OVER (ORDER BY SUM(tot_sales) DESC) sales_quartile FROM orders GROUP BY cust_nbr ORDER BY 3,2 DESC;

          NTITLE(4)把紀(jì)錄以 SUM(tot_sales)排序分成4.

          3.4 輔助分析列和Windows Function

          報表除了基本事實數(shù)據(jù)外,總希望旁邊多些全年總銷量,到目前為止的累計銷量,前后三個月的平均銷量這樣的列來參考.

          這種前后三個月的平均和到目前為止的累計銷量就叫windows function, 見下例

          SELECT month, SUM(tot_sales) monthly_sales, SUM(SUM(tot_sales)) OVER (ORDER BY month ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_preceeding FROM orders GROUP BY month ORDER BY month;

          SELECT month, SUM(tot_sales) monthly_sales, AVG(SUM(tot_sales)) OVER (ORDER BY month ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) rolling_avg FROM orders GROUP BY month ORDER BY month;

          Windows Function的關(guān)鍵就是Windows子句的幾個取值

          1 PRECEDING 之前的一條記錄

          1 FOLLOWING 之后的一條記錄

          UNBOUNDED PRECEDING 之前的所有記錄

          CURRENT ROW 當(dāng)前紀(jì)錄

          4.SubQuery總結(jié)

          SubQuery天天用了,理論上總結(jié)一下.SubQuery 分三種

          1.Noncorrelated 子查詢 最普通的樣式.

          2.Correlated Subqueries 把父查詢的列拉到子查詢里面去,頭一回cyt教我的時候理解了半天.

          3.Inline View 也被當(dāng)成最普通的樣式用了.

          然后Noncorrelated 子查詢又有三種情況

          1.返回一行一列 where price < (select max(price) from goods )

          2.返回多行一列 where price>= ALL (select price from goods where type=2)

          or where NOT price< ANY(select price from goods where type=2)

          最常用的IN其實就是=ANY()

          3.返回多行多列 一次返回多列當(dāng)然就節(jié)省了查詢時間

          UPDATE monthly_orders SET (tot_orders, max_order_amt) = (SELECT COUNT(*), MAX(sale_price) FROM cust_order) DELETE FROM line_item WHERE (order_nbr, part_nbr) IN (SELECT order_nbr, part_nbr FROM cust_order c)

          ========================================
          /*--------理解grouping sets
          select a, b, c, sum( d ) from t
          group by grouping sets ( a, b, c )

          等效于

          select * from (
          select a, null, null, sum( d ) from t group by a
          union all
          select null, b, null, sum( d ) from t group by b
          union all
          select null, null, c, sum( d ) from t group by c
          )
          */



          歡迎大家訪問我的個人網(wǎng)站 萌萌的IT人

          posted on 2007-05-18 10:48 見酒就暈 閱讀(172) 評論(0)  編輯  收藏 所屬分類: DB

          <2025年6月>
          25262728293031
          1234567
          891011121314
          15161718192021
          22232425262728
          293012345

          導(dǎo)航

          統(tǒng)計

          常用鏈接

          留言簿(3)

          我參與的團(tuán)隊

          隨筆分類

          隨筆檔案

          文章分類

          文章檔案

          收藏夾

          BLOG

          FRIENDS

          LIFE

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 海伦市| 阿合奇县| 湄潭县| 外汇| 抚松县| 区。| 屏南县| 安图县| 澄城县| 兴国县| 军事| 枞阳县| 宁波市| 盐池县| 定边县| 务川| 都昌县| 旌德县| 达拉特旗| 泽州县| 仲巴县| 聂荣县| 南江县| 临澧县| 广德县| 定西市| 古丈县| 五莲县| 体育| 夏邑县| 丹凤县| 呼玛县| 石棉县| 屏边| 济南市| 琼海市| 天水市| 滁州市| 徐闻县| 东莞市| 贵港市|