Decode360's Blog

          業精于勤而荒于嬉 QQ:150355677 MSN:decode360@hotmail.com

            BlogJava :: 首頁 :: 新隨筆 :: 聯系 ::  :: 管理 ::
            302 隨筆 :: 26 文章 :: 82 評論 :: 0 Trackbacks

          1、over函數(基本分析函數):

          ?

          ==code example 1:==========================================

          ????date??????sale
          ???? 1?????????? 20
          ???? 2?????????? 15
          ???? 3?????????? 14
          ???? 4?????????? 18
          ???? 5?????????? 30

          ?

          使用分析函數逐條匯總sale:

          select date , sum (sale)over( order by date ) sum from t1;

          ???date???sale?????sum

          ??? 1?????? 20??????? 20??----------1天???????????
          ??? 2?????? 15??????? 35??----------1天+2天???????????
          ??? 3?????? 14??????? 49??----------1天+2天+3天???????????
          ??? 4?????? 18??????? 67??????……
          ??? 5?????? 30??????? 97??????……

          另:使用count、avg、min、max等均與此類同。

          ?

          ==code example 2:==========================================

          ??? A?? B?? C?
          ??? m?? a?? 2??????????????????????
          ??? n?? a?? 3??????????????????????
          ??? m?? a?? 2??????????????????????
          ??? n?? b?? 2??????????????????????
          ??? n?? b?? 1??????????????????????
          ??? x?? b?? 3??????????????????????
          ??? x?? b?? 2??????????????????????
          ??? x?? b?? 4??????????????????????
          ??? h?? b?? 3

          ?

          使用分析函數分項匯總C:

          select a,c, sum (c)over( partition by a) sum from t2 ;

          ?? A?? B?? C??????? SUM
          ?? h?? b?? 3??????? 3????????????????????????
          ?? m?? a?? 2??????? 4????????????????????????
          ?? m?? a?? 2??????? 4????????????????????????
          ?? n?? a?? 3??????? 6????????????????????????
          ?? n?? b?? 2??????? 6????????????????????????
          ?? n?? b?? 1??????? 6????????????????????????
          ?? x?? b?? 3??????? 9????????????????????????
          ?? x?? b?? 2??????? 9????????????????????????
          ?? x?? b?? 4??????? 9
          ??

          ?

          若無須分項匯總,則使用partition by null

          select a,c, sum (c)over( partition by null) sum from t2 ;

          ?? A?? B?? C??????? SUM
          ?? h?? b?? 3????????22????????????????????????
          ?? m?? a?? 2????????22????????????????????????
          ?? m?? a?? 2??????? 22????????????????????????
          ?? n?? a?? 3??????? 22????????????????????????
          ?? n?? b?? 2??????? 22????????????????????????
          ?? n?? b?? 1??????? 22????????????????????????
          ?? x?? b?? 3??????? 22????????????????????????
          ?? x?? b?? 2??????? 22????????????????????????
          ?? x?? b?? 4??????? 22????????????????????????

          ?

          ==code example 3:==========================================

          ??? NAME??CLASS? S??????????????????????????
          ??? fda??? 1????? 80?????????????????????
          ??? ffd??? 1????? 78?????????????????????
          ??? dss??? 1????? 95?????????????????????
          ??? cfe??? 2????? 74?????????????????????
          ??? gds??? 2????? 92?????????????????????
          ??? gf???? 3????? 99?????????????????????
          ??? ddd??? 3????? 99?????????????????????
          ??? adf??? 3????? 45?????????????????????
          ??? asdf?? 3????? 55?????????????????????
          ??? 3dd??? 3????? 78
          ??????????

          ?

          統計每個班的第一名成績:

          select * from ??????????????????????????????????????????????????????????????????????

          ( select name , class ,s,rank()over( partition by class order by s desc ) mm

          from t1)???????????????????????????????????????????????????????????????????????????

          where mm= 1

          ??? NAME?? CLASS??? S????????MM????????????????????????????????????????????????????????????????????????????????????????
          ??? dss??????1?????? 95????????1????
          ??? gds????? 2??????92????????1??????????????????????
          ??? gf?????? 3??????99????????1??????????????????????
          ??? ddd????? 3??????99????????1
          ?

          ?

          ==code example 4:=================★★★★====================

          ??? ID???? NUM
          ??? 1?????? 0
          ??? 2?????? 2
          ??? 3?????? 2
          ??? 4?????? 0
          ??? 5?????? 0
          ??? 6????? ?2????
          ??? 7????? ?2
          ??? 8????? ?0
          ??? 9????? ?1
          ??? 10???? ?1

          ?

          使用開窗函數進行匯總的研究:

          selectid,sum(num)over(orderbyidrangebetween3 preceding and3 following) from t1;

          ??? ID???? SUM(NUM)OVER(ORDERBYIDRANGEBET
          ??? 1???????????? 4
          ??? 2???????????? 4
          ??? 3???????????? 6
          ??? 4???????????? 8
          ??? 5???????????? 8
          ??? 6???????????? 7
          ??? 7???????????? 6
          ??? 8???????????? 6
          ??? 9???????????? 6
          ??? 10????????????4

          說明:range between代表了該id前后數值區間(注意是數值,不是行數)的數字進行匯總。

          ?

          若要通過行開窗,則將range改為rows

          selectid,sum(num)over(orderbyid?rowsbetween3 preceding and3 following) from t1;

          此例中的運行結果與上面相同(因為行號和數值相同)

          若需要某一邊不設限,則使用關鍵字unbounded

          selectid,sum(num)over(orderbyidrowsbetweenunbounded? preceding and2? following) from t1;

          ?

          ?

          ?

          2、排序函數的研究:

          ?
          一般的3中排序函數,注意排序的區別:

          select col,value,rank() over([partitionby col] orderbyvalue) from tmp1;

          --------------排名相同則重復,之后跳過

          select col,value,dense_rank() over([partitionby col] orderbyvalue) from tmp1;

          --------------排名相同則重復,之后不跳過

          select col,value,row_number() over([partitionby col] orderbyvalue) from tmp1;

          --------------排名相同也不重復

          select col,value,cume_dist() over([partitionby col] orderbyvalue) from tmp1;

          ----------------0-1之間比率,最大1,rank形式

          select col,value,percent_rank() over([partitionby col] orderbyvalue) from tmp1;

          ----------------0-1之間比率,不到1,decse_rank形式

          ?

          ?

          另一種有趣的排序用法,確定某數在序列中的排位:

          select col,rank(121) within group(orderbyvaluedesc) from tmp1 groupby col

          --------------121在各個col中的value中的排位(排名相同則重復,之后跳過)

          select col,dense_rank(121) within group(orderbyvaluedesc) from tmp1 groupby col;

          --------------121在各個col中的value中的排位(排名相同則重復,之后不跳過)

          select col,cume_dist(121) within group(orderbyvaluedesc) from tmp1 groupby col;

          --------------121在各個col中的value中的位置占比(結果均在0-1之間,用rank的規則)

          select col,percent_rank(121) within group(orderbyvaluedesc) from tmp1 groupby col;

          --------------121在各個col中的value中的位置占比(結果均在0-1之間,用decse_rank的規則)

          ?

          ?

          ?
          KEEP(DENSE_RANK FIRST ORDER BY ) 的研究
          ?

          有表test數據如下:

          ???ID? MC?? SL
          ??? 1?? 111?? 1
          ??? 1?? 222?? 1
          ??? 1?? 333?? 2
          ??? 1?? 555?? 3
          ??? 1?? 666?? 3
          ??? 2?? 111?? 1
          ??? 2?? 222?? 1
          ??? 2?? 333?? 2
          ??? 2?? 555?? 2

          selectid,mc,sl,

          min(mc) keep (DENSE_RANK firstORDERBY sl) over(partitionbyid) A,

          max(mc) keep (DENSE_RANK firstORDERBY sl) over(partitionbyid) B,

          min(mc) keep (DENSE_RANK last? ORDERBY sl) over(partitionbyid) C,

          max(mc) keep (DENSE_RANK last? ORDERBY sl) over(partitionbyid) D

          from test;

          ??? ID?? MC? SL? A?? B?? C?? D
          ??? 1?? 111? 1? 111 222 555 666
          ??? 1?? 222? 1? 111 222 555 666
          ??? 1?? 333? 2? 111 222 555 666
          ??? 1?? 555? 3? 111 222 555 666
          ??? 1?? 666? 3? 111 222 555 666
          ??? 2?? 111? 1? 111 222 333 555
          ??? 2?? 222? 1? 111 222 333 555
          ??? 2?? 333? 2? 111 222 333 555
          ??? 2?? 555? 2? 111 222 333 555

          具體邏輯如下:以min(mc) keep (DENSE_RANK firstORDERBY sl) over(partitionbyid)? 為例
          1、確認over(partitionbyid),選取ID=1的5行
          2、通過(DENSE_RANK ORDERBY sl),對ID=1的5行中的sl進行排序
          3、通過keep (DENSE_RANK firstORDERBY sl),選出其中的第一個數據sl=1
          4、用min(mc)選取id=1 & sl=1時的mc最小值

          ?
          3、幾個層級函數的使用:
          ?

          ① 首先是grouping sets的使用方法:

          select a,b,c,sum(d) from t

          groupbygroupingsets (a,b,c);

          上面這個語句等同于一下語句:

          select * from

          (select a,null,null,sum( d ) from t groupby a

          unionall

          ?selectnull,b,null,sum( d ) from t groupby b

          unionall

          ?selectnull,null,c,sum( d ) from t groupby c);

          ?

          rollup函數:

          select a,b,c,sum(d) from t

          groupbyrollup(a, b, c);

          等同于:

          select * from

          (select a,b,c,sum(d) from t groupby a, b, c

          unionall

          ?select a,b,null,sum(d) from t groupby a, b

          unionall

          ?select a,null,null,sum(d) from t groupby a

          unionall

          ?selectnull,null,null,sum(d) from t);

          --------------------------------------------------------

          所以說:

          select a,b,c,sum(d) from t

          groupbygroupingsets ((a,b,c),(a,b),a,());

          等同與

          select a,b,c,sum(d) from t

          groupbyrollup(a, b, c);

          ?

          cube函數:

          select a,b,c,sum(d) from t

          groupbycube(a, b, c);

          等同于:

          select * from

          (select a,b,c,sum(d) from t groupby a, b, c

          unionall

          ?select a,b,null,sum(d) from t groupby a, b

          unionall

          ?select a,null,c,sum(d) from t groupby a, c

          unionall

          ?selectnull,b,c,sum(d) from t groupby b, c

          unionall

          ?select a,null,null,sum(d) from t groupby a

          unionall

          ?selectnull,b,null,sum(d) from t groupby b

          unionall

          ?selectnull,null,c,sum(d) from t groupby c

          unionall

          ?selectnull,null,null,sum(d) from t);

          --------------------------------------------------------

          以所有可以組合的種類匯總!

          ?

          ④ Grouping() 函數的用法
          以上的grouping sets、rollup、Cube函數在匯總時均會涉及到null值
          如何對這些null進行自定義呢?
          需要使用Grouping()函數

          select

          decode(grouping(a),1,'all a',a) a,

          decode(grouping(b),1,'all b',b) b,

          decode(grouping(c),1,'all c',c) c,

          sum(d) from t

          groupbycube(a,b,c);

          則:所有a列為null處顯示all a,其他列類推

          ?
          我的綜合應用

          select organ_id,decode(grouping(organ_id),1,'合計',min(organ_name)) organ_name,

          sum(decode(to_char(signdate,'yyyymm'),'200801',prem,0))/10000一月,

          sum(decode(to_char(signdate,'yyyymm'),'200802',prem,0))/10000二月,

          sum(decode(to_char(signdate,'yyyymm'),'200803',prem,0))/10000三月,

          sum(decode(to_char(signdate,'yyyymm'),'200804',prem,0))/10000四月,

          sum(decode(to_char(signdate,'yyyymm'),'200805',prem,0))/10000五月,

          sum(decode(to_char(signdate,'yyyymm'),'200806',prem,0))/10000六月,

          sum(decode(to_char(signdate,'yyyymm'),'200807',prem,0))/10000七月,

          sum(decode(to_char(signdate,'yyyy'),'2008',prem,0))/10000? 合計

          from t_initial_prem

          where branchtype='1'

          and appflag in ('1','4')---無必要

          and ctflag <> 'N'

          groupbyrollup(organ_id)

          orderby1;

          ?

          ?
          4、lag和lead函數的使用技巧:
          ?
          selectrownumfrom t1;
          ROWNUM
          ?1
          ?2
          ?3
          ?4
          ?5
          ?6
          ?7
          ?8
          ?9
          ?10

          selectrownum,lag(rownum,3,8) over(orderbyrownum) LAG,

          lead(rownum,3,8) over(orderbyrownum) LEAD from t1;

          ROWNUM?? LAG?? LEAD
          ?1??????? 8???? 4
          ?2??????? 8???? 5
          ?3??????? 8???? 6
          ?4??????? 1???? 7
          ?5??????? 2???? 8
          ?6??????? 3???? 9
          ?7??????? 4???? 10
          ?8??????? 5???? 8
          ?9??????? 6???? 8
          ?10?????? 7???? 8

          LAG ——列出某字段的前N行的值;
          LEAD——列出某字段的后N行的值;
          LAG(arg1,arg2,arg3):
          arg1是從其他行返回的表達式
          arg2是希望檢索的當前行分區的偏移量。是一個正的偏移量,時一個往回檢索以前的行的數目。
          arg3是在arg2表示的數目超出了分組的范圍時返回的值(必須為數字或空)
          ?
          ?
          ?
          =======================================================================================
          ?
          ?

          Oracle層次查詢和分析函數

          在號段選取中的應用

          作者:lastwinner
          BLOG:
          http://lastwinner.itpub.net

          摘要

          一組連續的數,去掉中間一些數,如何求出剩下的數的區間(即號段)?知道號段的起止,如何求出該號段內所有的數?知道一個大的號段范圍和已經取過的號段,如何求出可用的號段?利用Oracle提供的強大的查詢功能以及分析函數,我們可以很輕松的解決上述問題。

          n關鍵詞:

          號段選取、連續數、斷點、層次查詢、分析函數、connect byrownumlevelleadlag


          1.問題的提出

          在實際工作中,我們常常會碰到號段選取的問題,例如:

          n一組連續的數,去掉中間一些數,要求出剩下的數的區間(即號段)例如:一串數字為1,2,3,4,7,9,10,則號段為1-4,7-7,9-10

          n知道號段的起止,要求出該號段內所有的數例如:號段為1-3,15-15,則號段內所有的數為1,2,3,15

          n一組數,中間可能有斷點,要求出缺失的數例如:一串數字為1,2,3,4,7,9,10,則缺失的數為5,6,8

          n已知大號段范圍及已用號段范圍,求可用號段范圍例如:大號段范圍0-999,已用號段范圍0-200,399-599,則可用號段范圍為201-398,600-999

          2.基礎知識

          先做下熱身運動,回顧一下層次查詢和leadlag函數的運用。

          2.1偽列rownumlevel

          偽列就是并非在表中真正存在的列。已有很多資料介紹rownumlevel這兩個偽列。這里只想強調一點,偽列是只針對結果集的

          2.2利用層次查詢構造連續的數

          n產生584個連續的數

          select * from (select rownum+4 from dual connect by rownum<5);

          select * from (select level+4 from dual connect by level<5);

          n8月為界,例如200581日,之前的在校學生入學年份為20012004,之后的為20022005。求當前日期下的在校學生入學年份:

          select * from (select to_char(add_months(sysdate, 4), 'yyyy') - rownum from dual connect by rownum<5);

          2.3用分析函數LeadLag獲得相鄰行的字段值

          select rn, lag(rn)over(order by rn) previos, lead(rn)over(order by rn) next from (select rownum+4 rn from dual connect by rownum<5);

          RNPREVIOSNEXT

          ---------- ---------- ----------

          5???6

          657

          768

          87

          簡單的說,在這里,Lag是獲得前一行的內容,而Lead是獲得后一行的內容。

          select rn, lag(rn,2,-1)over(order by rn) previos, lead(rn,2,-1) over(order by rn) next from (select rownum+4 rn from dual connect by rownum<5);

          RNPREVIOSNEXT

          ---------- ---------- ----------

          5-17

          6-18

          75-1

          86-1

          這里,通過指定offset參數來獲得兩行前的內容和兩行后的內容,如果offset超出范圍并且未設定默認值-1,那么系統會自動將其值設為NULL

          3.問題的解決

          有了基礎知識的積累,我們就可以解決前面提到的問題。

          3.1已知號碼求號段

          3.1.1題例

          我有一個表結構,

          fphm,kshm

          2014,00000001

          2014,00000002

          2014,00000003

          2014,00000004

          2014,00000005

          2014,00000007

          2014,00000008

          2014,00000009

          2013,00000120

          2013,00000121

          2013,00000122

          2013,00000124

          2013,00000125

          (第二個字段內可能是連續的數據,可能存在斷點。)

          怎樣能查詢出來這樣的結果,查詢出連續的記錄來。

          就像下面的這樣?

          2014,00000001,00000005

          2014,00000009,00000007

          2013,00000120,00000122

          2013,00000124,00000125

          3.1.2解答

          思路:利用lag取得前一行的kshm,然后和本行的kshm想比,如果差值為1,說明這一行和上一行是連續的。由于首尾的特殊性,故而需要先用max和min來獲得首尾點。

          select fphm, nvl(lag(e)over(partition by fphm order by s),minn) ST, nvl(S,maxn) EN from

          (select fphm, lag(kshm,1) over(partition by fphm order by kshm) S, kshm E, min(kshm)over(partition by fphm) minn, max(kshm) over(partition by fphm) maxn from t)

          where nvl(E-S-1,1)<>0;

          FPHM STEN

          ---------- ---------- ----------

          20130000012000000122

          20130000012400000125

          20140000000100000005

          20140000000700000009

          3.2根據號段求出包含的數

          3.2.1題例

          有表及測試數據如下:

          CREATE TABLE T20

          (

          ID NUMBER(2),

          S NUMBER(5),

          E NUMBER(5)

          );

          INSERT INTO T20 ( ID, S, E ) VALUES ( 1, 10, 11);

          INSERT INTO T20 ( ID, S, E ) VALUES ( 2, 1, 5);

          INSERT INTO T20 ( ID, S, E ) VALUES ( 3, 88, 92);

          COMMIT;

          S為號段起點,E為號段終點,求出起點和終點之間的數(包括起點和終點)

          3.2.2解答

          很明顯,這需要構造序列來解決問題

          select a.id, a.s, a.e,b.dis, a.S+b.dis-1 h from

          t20 a,

          (select rownum dis from

          (select max(e-s)+1 gap from t20)

          connect by rownum<=gap) b

          where a.e>=a.s+b.dis-1

          order by a.id, 4

          運行結果:

          IDSEDISH

          ---------- ---------- ---------- ---------- ----------

          11011110

          11011211

          21511

          21522

          21533

          21544

          21555

          38892188

          38892289

          38892390

          38892491

          38892592

          我們再看下面這種做法:

          select a.id, a.s, a.e,rownum, a.S+rownum-1 h from

          t20 a ,

          (select id, e-s+1 gap from t20 where id=2) b

          where a.id=b.id

          connect by rownum<=gap

          IDSE ROWNUMH

          ---------- ---------- ---------- ---------- ----------

          21511

          21522

          21533

          21544

          21555

          嗯,得到的結果也是正確的,若我們把粗斜體字部分去掉后,看看結果是什么樣:

          IDSE ROWNUMH

          ---------- ---------- ---------- ---------- ----------

          11011110

          11011211

          21533

          21544

          21555

          21566

          388 92794

          這樣的結果,顯然不是我們需要的,更何況,這是錯誤的。由此更能深入理解,偽列是只針對結果集的

          3.3求缺失的號

          3.3.1題例

          table T,列:serial_no

          我想能夠查詢一下serial_no這個字段的不連續的值。

          例如:

          serial_no

          1

          2

          3

          4

          6

          8

          9

          10

          我想一個sql語句查出來缺失的號碼,

          顯示結果為:

          5

          7

          3.3.2解答

          思路:找出數B和它前面的數A進行比較(數按從大到小進行排序),如果B-A=1,則說明是連續的,中間沒有斷點。

          select distinct s+level-1 rlt from (select lag(serial_no,1) over(order by serial_no)+1 S, serial_no-1 E from t) where E-S<>0 connect by level<=e-s

          3.4求尚未使用的號段

          3.4.1題例

          A結構:

          bill_type_id varchar2(1),

          bill_start number,

          bill_end number,

          office_level varchar2(4)

          數據如下:

          A 0 999 1

          A 0 199 2

          A 300 499 2

          A 700 799 2

          sql目的是取出包含在level1級別里的,還沒有錄入level2級別的號段。

          3.4.2解答

          這個好像是3.13.3這兩個問題的逆問題

          創建表及測試數據:

          CREATE TABLE T8

          (

          A NUMBER(4),

          B NUMBER(4),

          C NUMBER(4),

          Q VARCHAR2(1 BYTE)

          );

          Insert into T8(A, B, C, Q)Values(555, 666, 2, 'A');

          Insert into T8(A, B, C, Q)Values(100, 199, 2, 'A');

          Insert into T8(A, B, C, Q)Values(0, 999, 1, 'A');

          Insert into T8(A, B, C, Q)Values(300, 499, 2, 'A');

          COMMIT;

          思路:將大號段的邊界與小號段的邊界相比,從大號段中將小號段“挖”掉,這樣剩下的就是可用號段了。

          select S,E from

          (

          SELECT NVL2(LAG(A)OVER(PARTITION BY Q ORDER BY A), B+1, MIN(A)OVER(PARTITION BY Q)) S,

          NVL(LEAD(A)OVER(PARTITION BY Q ORDER BY A)-1, MAX(B)OVER(PARTITION BY Q)) E

          from t8 START WITH C=1 CONNECT BY C-1 = PRIOR C AND Q= PRIOR Q

          )

          where s<=e

          運行結果:

          SE

          ---------- ----------

          099

          200299

          500554

          667999

          參考資料

          n參考資料

          uOracle 8i SQL Reference

          uhttp://lastwinner.itpub.net

          uhttp://hmxxyy.itpub.net/

          n論壇相關討論帖子

          u請教查詢語句的寫法?http://www.itpub.net/435578.html

          u如何sql查詢出連續號碼段http://www.itpub.net/354052.html

          u請教關于號段選取的sql寫法http://www.itpub.net/480536.html

          u知道號段起止,如何選擇該號段內的所有號碼?http://www.itpub.net/701508.html

          作者簡介

          lastwinner,主要關注于Oracle開發以及Web開發。歡迎訪問我在ITPUBBLOGhttp://lastwinner.itpub.net

          *:本文為本人參加ITPUB 2007香山年會的論文。

          lastwinner 發表于:2007.02.05 20:13 ::分類: ( Oracle , ) ::閱讀:(1519次) :: 評論 (7)
          ?

          ?




          -The End-

          posted on 2008-08-16 06:25 decode360-3 閱讀(331) 評論(0)  編輯  收藏 所屬分類: SQL Dev
          主站蜘蛛池模板: 丰镇市| 武威市| 云南省| 明光市| 屏东县| 新丰县| 鄄城县| 高尔夫| 偃师市| 兴业县| 文安县| 武邑县| 辽宁省| 团风县| 福贡县| 留坝县| 民乐县| 巴东县| 铜鼓县| 温州市| 武夷山市| 黑龙江省| 张家口市| 汾西县| 手游| 县级市| 台北市| 枣阳市| 饶平县| 炉霍县| 扶沟县| 鸡泽县| 平舆县| 安西县| 绥宁县| 平顶山市| 墨脱县| 扬州市| 孟津县| 资兴市| 石城县|