隨筆-314  評論-209  文章-0  trackbacks-0

          I、關系數據庫設計范式介紹

          1.1 第一范式(1NF)無重復的列

           
                所謂第一范式(1NF)是指數據庫表的每一列都是不可分割的基本數據項,同一列中不能有多個值,即實體中的某個屬性不能有多個值或者不能有重復的屬性。如果出現重復的屬性,就可能需要定義一個新的實體,新的實體由重復的屬性構成,新實體與原實體之間為一對多關系。在第一范式(1NF)中表的每一行只包含一個實例的信息。簡而言之,第一范式就是無重復的列。

          說明:在任何一個關系數據庫中,第一范式(1NF)是對關系模式的基本要求,不滿足第一范式(1NF)的數據庫就不是關系數據庫。

          1.2 第二范式(2NF)屬性完全依賴于主鍵[消除部分子函數依賴]

           
                第二范式(2NF)是在第一范式(1NF)的基礎上建立起來的,即滿足第二范式(2NF)必須先滿足第一范式(1NF)。第二范式(2NF)要求數據庫表中的每個實例或行必須可以被惟一地區分。為實現區分通常需要為表加上一個列,以存儲各個實例的惟一標識。例如員工信息表中加上了員工編號(emp_id)列,因為每個員工的員工編號是惟一的,因此每個員工可以被惟一區分。這個惟一屬性列被稱為主關鍵字或主鍵、主碼。
                  第二范式(2NF)要求實體的屬性完全依賴于主關鍵字。所謂完全依賴是指不能存在僅依賴主關鍵字一部分的屬性,如果存在,那么這個屬性和主關鍵字的這一部分應該分離出來形成一個新的實體,新實體與原實體之間是一對多的關系。為實現區分通常需要為表加上一個列,以存儲各個實例的惟一標識。簡而言之,第二范式就是屬性完全依賴于主鍵。

          1.3 第三范式(3NF)屬性不依賴于其它非主屬性[消除傳遞依賴]


                      滿足第三范式(3NF)必須先滿足第二范式(2NF)。簡而言之,第三范式(3NF)要求一個數據庫表中不包含已在其它表中已包含的非主關鍵字信息。例如,存在一個部門信息表,其中每個部門有部門編號(dept_id)、部門名稱、部門簡介等信息。那么在的員工信息表中列出部門編號后就不能再將部門名稱、部門簡介等與部門有關的信息再加入員工信息表中。如果不存在部門信息表,則根據第三范式(3NF)也應該構建它,否則就會有大量的數據冗余。簡而言之,第三范式就是屬性不依賴于其它非主屬性。


          II、范式應用實例剖析


                  下面以一個學校的學生系統為例分析說明,這幾個范式的應用。首先第一范式(1NF):數據庫表中的字段都是單一屬性的,不可再分。這個單一屬性由基本類型構成,包括整型、實數、字符型、邏輯型、日期型等。在當前的任何關系數據庫管理系統(DBMS)中,傻瓜也不可能做出不符合第一范式的數據庫,因為這些DBMS不允許你把數據庫表的一列再分成二列或多列。因此,你想在現有的DBMS中設計出不符合第一范式的數據庫都是不可能的。
          首先我們確定一下要設計的內容包括那些。學號、學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話等信息。為了簡單我們暫時只考慮這些字段信息。我們對于這些信息,說關心的問題有如下幾個方面。
          • 學生有那些基本信息
          • 學生選了那些課,成績是什么
          • 每個課的學分是多少
          • 學生屬于那個系,系的基本信息是什么。

          2.1 第二范式(2NF)實例分析

           
                首先我們考慮,把所有這些信息放到一個表中(學號,學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話)下面存在如下的依賴關系。
                  (學號)→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)
                   (課程名稱) → (學分)
                  (學號,課程)→ (學科成績)
          2.1.1 問題分析
           
                因此不滿足第二范式的要求,會產生如下問題 

                  數據冗余: 同一門課程由n個學生選修,"學分"就重復n-1次;同一個學生選修了m門課程,姓名和年齡就重復了m-1次。

                  更新異常:
                       1)若調整了某門課程的學分,數據表中所有行的"學分"值都要更新,否則會出現同一門課程學分不同的情況。
                      2)假設要開設一門新的課程,暫時還沒有人選修。這樣,由于還沒有"學號"關鍵字,課程名稱和學分也無法記錄入數據庫。

                 刪除異常 : 假設一批學生已經完成課程的選修,這些選修記錄就應該從數據庫表中刪除。但是,與此同時,課程名稱和學分信息也被刪除了。很顯然,這也會導致插入異常。
          2.1.2 解決方案
           
                把選課關系表SelectCourse改為如下三個表:
          • 學生:Student(學號,姓名, 年齡,性別,系別,系辦地址、系辦電話);
          • 課程:Course(課程名稱, 學分);
          • 選課關系:SelectCourse(學號, 課程名稱, 成績)。

          2.2 第三范式(3NF)實例分析


                  接著看上面的學生表Student(學號,姓名, 年齡,性別,系別,系辦地址、系辦電話),關鍵字為單一關鍵字"學號",因為存在如下決定關系:

                 (學號)→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)
                  但是還存在下面的決定關系 
                 (學號) → (所在學院)→(學院地點, 學院電話)
                  即存在非關鍵字段"學院地點"、"學院電話"對關鍵字段"學號"的傳遞函數依賴。 
                  它也會存在數據冗余、更新異常、插入異常和刪除異常的情況。 (數據的更新,刪除異常這里就不分析了,可以參照2.1.1進行分析)

                  根據第三范式把學生關系表分為如下兩個表就可以滿足第三范式了:

                  學生:(學號, 姓名, 年齡, 性別,系別);
                  系別:(系別, 系辦地址、系辦電話)。

          總結


                 上面的數據庫表就是符合I,II,III范式的,消除了數據冗余、更新異常、插入異常和刪除異常。
          posted on 2009-01-04 11:53 xzc 閱讀(44853) 評論(17)  編輯  收藏 所屬分類: Oracle

          評論:
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2009-04-28 20:59 | 炅霂
          講的還不錯,值得初學者學習……  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2009-05-07 15:20 | helloqidi
          非常不錯的講解,學習了,謝謝啦!  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2009-05-17 10:22 | syd
          講的的確不錯,很適合我們這些正在對范式迷茫的人看啊,頂啦!!!!!  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明)[未登錄] 2009-06-11 13:27 | maggie
          thanks
            回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2009-06-15 14:57 | 老實人
          感謝樓主的詳細介紹三范式,感謝!  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2009-09-11 10:42 | Xkive
          (學號)→ (姓名, 年齡,性別,系別,系辦地址、系辦電話)
          但是還存在下面的決定關系
          (學號) → (所在學院)→(學院地點, 學院電話)
          即存在非關鍵字段"學院地點"、"學院電話"對關鍵字段"學號"的傳遞函數依賴。

          --------這個...."所在學院,學院地點, 學院電話"哪兒來的呢?應該是"系別,系辦地址、系辦電話"吧??把偶看得郁悶了好一陣.......................  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2010-03-18 16:45 | #
          謝謝啦!你是我啟蒙,你是我靈光,你是我的東風  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2010-03-23 16:17 | ldhfssq
          thx~  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2010-03-30 00:41 | de
          接著忽悠~  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2010-07-19 17:52 | 士大夫
          抄的吧?????怎么例子和解說都對不上啊 ?@Xkive
            回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2011-04-13 17:33 | 11
          講的太好了,通俗化  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2011-09-21 12:41 | 七木
          第一范式要求不能有重復的值。要求屬性不能有多個值和重復。例子中學生表的系別屬性不就重復了嗎?
          第二范式完全依賴于主鍵。對于關系表SelectCourse(學號, 課程名稱, 成績),主鍵是什么呢?三列都有可能重復。
          剛開始接觸數據庫設計,菜鳥問題希望作者大人能解答,謝謝  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2011-10-07 10:31 | 12
          第一范式:所有屬性都保持原子性,即:每個屬性不能包含子屬性,如出生日期日期屬性:年、月、日。可以將三個屬性(年、月、日)都作為表的一個屬性,滿足第一范式,若該表包含出生日期屬性,而出生日期屬性又包含年、月、日三屬性,同時出現在一個表中,則不滿足第一范式。
          第二范式:是滿足第一范式的基礎上的。每個表都有一個主鍵,該主鍵可能包含幾個主屬性,如作者的student表(學號,學生姓名、年齡、性別、課程、課程學分、系別、學科成績,系辦地址、系辦電話)中的主鍵為(學號,課程,系別)。第二范式要求所有非主屬性對主鍵的完全依賴。對主鍵的完全依賴就是指不存在某一個屬性既依賴于主鍵,同時來依賴于主鍵中的某一個或幾個主屬性。student表中的課程->課程學分,系別->系辦地址,都是對主鍵的部分依賴,所以不滿足第二范式。
          第三范式和作者解釋的一樣。  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2011-11-23 17:41 | 徐成偉
          經典  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2011-12-22 16:14 | sany
          講的不錯 俺收藏了  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明) 2012-08-23 11:29 | 柯柏文
          接著忽悠,這里解釋的第二范式根本就是忽悠。  回復  更多評論
            
          # re: 數據庫設計準則(第一、第二、第三范式說明)[未登錄] 2014-03-15 20:51 | Allen
          第三范式怎么和第二差別不大

          只是分的細點。能通俗的點破第二第三的區別嗎?  回復  更多評論
            
          主站蜘蛛池模板: 禄丰县| 阿克苏市| 连山| 独山县| 沾益县| 资阳市| 汝南县| 静海县| 浦县| 平乡县| 兰溪市| 广南县| 积石山| 百色市| 宝兴县| 景洪市| 合阳县| 宾川县| 施甸县| 西昌市| 永川市| 玉山县| 舟山市| 壶关县| 延长县| 巩义市| 常宁市| 滁州市| 新绛县| 彭山县| 谷城县| 台北市| 平邑县| 井陉县| 郸城县| 凯里市| 冕宁县| 卓尼县| 乌兰浩特市| 肃宁县| 五大连池市|