理解數(shù)據(jù)庫(kù)范式
          系統(tǒng)是短暫的
          數(shù)據(jù)是永恒的
          數(shù) 據(jù)庫(kù)范式是數(shù)據(jù)庫(kù)設(shè)計(jì)中必不可少的知識(shí),沒(méi)有對(duì)范式的理解,就無(wú)法設(shè)計(jì)出高效率、優(yōu)雅的數(shù)據(jù)庫(kù)。甚至設(shè)計(jì)出錯(cuò)誤的數(shù)據(jù)庫(kù)。而想要理解并掌握范式卻并不是那 么容易。教科書(shū)中一般以關(guān)系代數(shù)的方法來(lái)解釋數(shù)據(jù)庫(kù)范式。這樣做雖然能夠十分準(zhǔn)確的表達(dá)數(shù)據(jù)庫(kù)范式,但比較抽象,不太直觀,不便于理解,更難以記憶。

          本 文用較為直白的語(yǔ)言介紹范式,旨在便于理解和記憶,這樣做可能會(huì)出現(xiàn)一些不精確的表述。但對(duì)于初學(xué)者應(yīng)該是個(gè)不錯(cuò)的入門(mén)。我寫(xiě)下這些的目的主要是為了加強(qiáng) 記憶,其實(shí)我也比較菜,我希望當(dāng)我對(duì)一些概念生疏的時(shí)候,回過(guò)頭來(lái)看看自己寫(xiě)的筆記,可以快速地進(jìn)入狀態(tài)。如果你發(fā)現(xiàn)其中用錯(cuò)誤,請(qǐng)指正。

                 下面開(kāi)始進(jìn)入正題:

          一、基礎(chǔ)概念

          要理解范式,首先必須對(duì)知道什么是關(guān)系數(shù)據(jù)庫(kù),如果你不知道,我可以簡(jiǎn)單的不能再簡(jiǎn)單的說(shuō)一下:關(guān)系數(shù)據(jù)庫(kù)就是用二維表來(lái)保存數(shù)據(jù)。表和表之間可以……(省略10W字)。

          然后你應(yīng)該理解以下概念:

          實(shí)體:現(xiàn)實(shí)世界中客觀存在并可以被區(qū)別的事物。比如“一個(gè)學(xué)生”、“一本書(shū)”、“一門(mén)課”等等。值得強(qiáng)調(diào)的是這里所說(shuō)的“事物”不僅僅是看得見(jiàn)摸得著的“東西”,它也可以是虛擬的,不如說(shuō)“老師與學(xué)校的關(guān)系”。

           
          屬性:教科書(shū)上解釋為:“實(shí)體所具有的某一特性”,由此可見(jiàn),屬性一開(kāi)始是個(gè)邏輯概念,比如說(shuō),“性別”是“人”的一個(gè)屬性。在關(guān)系數(shù)據(jù)庫(kù)中,屬性又是個(gè)物理概念,屬性可以看作是“表的一列”。

           
          元組:表中的一行就是一個(gè)元組。

           
          分量:元組的某個(gè)屬性值。在一個(gè)關(guān)系數(shù)據(jù)庫(kù)中,它是一個(gè)操作原子,即關(guān)系數(shù)據(jù)庫(kù)在做任何操作的時(shí)候,屬性是“不可分的”。否則就不是關(guān)系數(shù)據(jù)庫(kù)了。

           
          碼:表中可以唯一確定一個(gè)元組的某個(gè)屬性(或者屬性組),如果這樣的碼有不止一個(gè),那么大家都叫候選碼,我們從候選碼中挑一個(gè)出來(lái)做老大,它就叫主碼。
           
          全碼:如果一個(gè)碼包含了所有的屬性,這個(gè)碼就是全碼。

           
          主屬性:一個(gè)屬性只要在任何一個(gè)候選碼中出現(xiàn)過(guò),這個(gè)屬性就是主屬性。

           
          非主屬性:與上面相反,沒(méi)有在任何候選碼中出現(xiàn)過(guò),這個(gè)屬性就是非主屬性。

           
          外碼:一個(gè)屬性(或?qū)傩越M),它不是碼,但是它別的表的碼,它就是外碼。

           
          二、6個(gè)范式

          好了,上面已經(jīng)介紹了我們掌握范式所需要的全部基礎(chǔ)概念,下面我們就來(lái)講范式。首先要明白,范式的包含關(guān)系。一個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)如果符合第二范式,一定也符合第一范式。如果符合第三范式,一定也符合第二范式…

           
           
           
          第一范式(1NF):屬性不可分。
          在前面我們已經(jīng)介紹了屬性值的概念,我們說(shuō),它是“不可分的”。而第一范式要求屬性也不可分。那么它和屬性值不可分有什么區(qū)別呢?給一個(gè)例子:

          name
           tel
           age
           
          大寶
           13612345678
           22
           
          小明
           13988776655
           010-1234567
           21
           
                 

          Ps:這個(gè)表中,屬性值“分”了。

          name
           tel
           age
           
          手機(jī)
           座機(jī)
           
          大寶
           13612345678
           021-9876543
           22
           
          小明
           13988776655
           010-1234567
           21
           

          Ps:這個(gè)表中,屬性 “分”了。

          這兩種情況都不滿足第一范式。不滿足第一范式的數(shù)據(jù)庫(kù),不是關(guān)系數(shù)據(jù)庫(kù)!所以,我們?cè)谌魏侮P(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)中,做不出這樣的“表”來(lái)。

           
           
           
          第二范式(2NF):符合1NF,并且,非主屬性完全依賴于碼。
          聽(tīng)起來(lái)好像很神秘,其實(shí)真的沒(méi)什么。

          一 個(gè)候選碼中的主屬性也可能是好幾個(gè)。如果一個(gè)主屬性,它不能單獨(dú)做為一個(gè)候選碼,那么它也不能確定任何一個(gè)非主屬性。給一個(gè)反例:我們考慮一個(gè)小學(xué)的教務(wù) 管理系統(tǒng),學(xué)生上課指定一個(gè)老師,一本教材,一個(gè)教室,一個(gè)時(shí)間,大家都上課去吧,沒(méi)有問(wèn)題。那么數(shù)據(jù)庫(kù)怎么設(shè)計(jì)?(學(xué)生上課表)

          學(xué)生
           課程
           老師
           老師職稱(chēng)
           教材
           教室
           上課時(shí)間
           
          小明
           一年級(jí)語(yǔ)文(上)
           大寶
           副教授
           《小學(xué)語(yǔ)文1》
           101
           14:30
           

          一個(gè)學(xué)生上一門(mén)課,一定在特定某個(gè)教室。所以有(學(xué)生,課程)->教室

          一個(gè)學(xué)生上一門(mén)課,一定是特定某個(gè)老師教。所以有(學(xué)生,課程)->老師

          一個(gè)學(xué)生上一門(mén)課,他老師的職稱(chēng)可以確定。所以有(學(xué)生,課程)->老師職稱(chēng)

          一個(gè)學(xué)生上一門(mén)課,一定是特定某個(gè)教材。所以有(學(xué)生,課程)->教材

          一個(gè)學(xué)生上一門(mén)課,一定在特定時(shí)間。所以有(學(xué)生,課程)->上課時(shí)間

          因此(學(xué)生,課程)是一個(gè)碼。

          然而,一個(gè)課程,一定指定了某個(gè)教材,一年級(jí)語(yǔ)文肯定用的是《小學(xué)語(yǔ)文1》,那么就有課程->教材。(學(xué)生,課程)是個(gè)碼,課程卻決定了教材,這就叫做不完全依賴,或者說(shuō)部分依賴。出現(xiàn)這樣的情況,就不滿足第二范式!

          有什么不好嗎?你可以想想:

          1、             校長(zhǎng)要新增加一門(mén)課程叫“微積分”,教材是《大學(xué)數(shù)學(xué)》,怎么辦?學(xué)生還沒(méi)選課,而學(xué)生又是主屬性,主屬性不能空,課程怎么記錄呢,教材記到哪呢? ……郁悶了吧?(插入異常)

          2、             下學(xué)期沒(méi)學(xué)生學(xué)一年級(jí)語(yǔ)文(上)了,學(xué)一年級(jí)語(yǔ)文(下)去了,那么表中將不存在一年級(jí)語(yǔ)文(上),也就沒(méi)了《小學(xué)語(yǔ)文1》。這時(shí)候,校長(zhǎng)問(wèn):一年級(jí)語(yǔ)文(上)用的什么教材啊?……郁悶了吧?(刪除異常)

          3、             校長(zhǎng)說(shuō):一年級(jí)語(yǔ)文(上)換教材,換成《大學(xué)語(yǔ)文》。有10000個(gè)學(xué)生選了這么課,改動(dòng)好大啊!改累死了……郁悶了吧?(修改異常)

          那應(yīng)該怎么解決呢?投影分解,將一個(gè)表分解成兩個(gè)或若干個(gè)表

          學(xué)生
           課程
           老師
           老師職稱(chēng)
           教室
           上課時(shí)間
           
          小明
           一年級(jí)語(yǔ)文(上)
           大寶
           副教授
           101
           14:30
           

          學(xué)生上課表新

          課程
           教材
           
          一年級(jí)語(yǔ)文(上)
           《小學(xué)語(yǔ)文1》
           

          課程的表

           
           
          第三范式(3NF):符合2NF,并且,消除傳遞依賴
          上面的“學(xué)生上課表新”符合2NF,可以這樣驗(yàn)證:兩個(gè)主屬性單獨(dú)使用,不用確定其它四個(gè)非主屬性的任何一個(gè)。但是它有傳遞依賴!

          在哪呢?問(wèn)題就出在“老師”和“老師職稱(chēng)”這里。一個(gè)老師一定能確定一個(gè)老師職稱(chēng)。

          有什么問(wèn)題嗎?想想:

          1、  老師升級(jí)了,變教授了,要改數(shù)據(jù)庫(kù),表中有N條,改了N次……(修改異常)

          2、  沒(méi)人選這個(gè)老師的課了,老師的職稱(chēng)也沒(méi)了記錄……(刪除異常)
          3、  新來(lái)一個(gè)老師,還沒(méi)分配教什么課,他的職稱(chēng)記到哪?……(插入異常)
          那應(yīng)該怎么解決呢?和上面一樣,投影分解:

          學(xué)生
           課程
           老師
           教室
           上課時(shí)間
           
          小明
           一年級(jí)語(yǔ)文(上)
           大寶
           101
           14:30
           

           
          老師
           老師職稱(chēng)
           
          大寶
           副教授
           

           
          BC范式(BCNF):符合3NF,并且,主屬性不依賴于主屬性
          若關(guān)系模式屬于第一范式,且每個(gè)屬性都不傳遞依賴于鍵碼,則R屬于BC范式。

          通常BC范式的條件有多種等價(jià)的表述:每個(gè)非平凡依賴的左邊必須包含鍵碼;每個(gè)決定因素必須包含鍵碼。

          BC范式既檢查非主屬性,又檢查主屬性。當(dāng)只檢查非主屬性時(shí),就成了第三范式。滿足BC范式的關(guān)系都必然滿足第三范式。

          還可以這么說(shuō):若一個(gè)關(guān)系達(dá)到了第三范式,并且它只有一個(gè)候選碼,或者它的每個(gè)候選碼都是單屬性,則該關(guān)系自然達(dá)到BC范式。

           
          一般,一個(gè)數(shù)據(jù)庫(kù)設(shè)計(jì)符合3NF或BCNF就可以了。在BC范式以上還有第四范式、第五范式。

          第四范式:要求把同一表內(nèi)的多對(duì)多關(guān)系刪除。

          第五范式:從最終結(jié)構(gòu)重新建立原始結(jié)構(gòu)。
          但在絕大多數(shù)應(yīng)用中不需要設(shè)計(jì)到這種程度。并且,某些情況下,過(guò)于范式化甚至?xí)?duì)數(shù)據(jù)庫(kù)的邏輯可讀性和使用效率起到阻礙。數(shù)據(jù)庫(kù)中一定程度的冗余并不一定是壞事情。如果你對(duì)第四范式、第五范式感興趣可以看一看專(zhuān)業(yè)教材,從頭學(xué)起,并且忘記我說(shuō)的一切,以免對(duì)你產(chǎn)生誤導(dǎo)。

           

          posted on 2011-03-04 17:23 sanmao 閱讀(753) 評(píng)論(2)  編輯  收藏

          FeedBack:
          # re: 數(shù)據(jù)庫(kù)范式|數(shù)據(jù)庫(kù)第一范式|數(shù)據(jù)庫(kù)第二范式
          2012-01-07 12:52 | user88
          小兄弟,你連1NF都沒(méi)搞明白,就胡亂的說(shuō)話,不怕貽笑大方?  回復(fù)  更多評(píng)論
            
          # re: 數(shù)據(jù)庫(kù)范式|數(shù)據(jù)庫(kù)第一范式|數(shù)據(jù)庫(kù)第二范式
          2012-01-07 12:58 | user88
          " 我們?cè)谌魏侮P(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)中,做不出這樣的“表”來(lái)。" --你對(duì)1NF的理解,我告訴你:
          name tel age
          大寶 13612345678 22
          小明 13988776655 , 010-1234567 21

          你想想看,你難道不能在TEL字段里,沒(méi)輸入 13988776655 , 010-1234567 嗎?二者中間可以加個(gè)空格,逗號(hào)或者分號(hào)都可以的。但是你必須從 語(yǔ)言的角度來(lái)理解這個(gè)1NF的定義(上例就是你所說(shuō)的不屬性值分了),它是不滿足1NF的。
          所以,你千萬(wàn)別再說(shuō)什么“我們?cè)谌魏侮P(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)中,做不出這樣的“表”來(lái)。" ”這樣可笑的話了!

            回復(fù)  更多評(píng)論
            

          只有注冊(cè)用戶登錄后才能發(fā)表評(píng)論。


          網(wǎng)站導(dǎo)航:
           

          常用鏈接

          留言簿(5)

          隨筆分類(lèi)

          隨筆檔案

          搜索

          •  

          最新評(píng)論

          閱讀排行榜

          評(píng)論排行榜

          主站蜘蛛池模板: 元江| 吉隆县| 山丹县| 天全县| 晋州市| 安阳县| 琼中| 徐汇区| 周口市| 嘉义市| 长乐市| 镇原县| 库伦旗| 万安县| 桐城市| 刚察县| 察雅县| 荔波县| 南漳县| 龙门县| 郎溪县| 大安市| 工布江达县| 安阳县| 运城市| 赣榆县| 内江市| 龙岩市| 泾川县| 密山市| 松潘县| 怀柔区| 溆浦县| 盐山县| 巨野县| 郧西县| 文昌市| 兴宁市| 思南县| 三亚市| 会同县|