數(shù)據(jù)倉(cāng)庫(kù)的出現(xiàn),并不是要取代數(shù)據(jù)庫(kù)。目前,大部分?jǐn)?shù)據(jù)倉(cāng)庫(kù)還是用關(guān)系數(shù)據(jù)庫(kù)管理系統(tǒng)來(lái)管理的??梢哉f(shuō),數(shù)據(jù)庫(kù)、數(shù)據(jù)倉(cāng)庫(kù)相輔相成、各有千秋。
數(shù)據(jù)庫(kù)是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是面向主題設(shè)計(jì)的。
數(shù)據(jù)庫(kù)一般存儲(chǔ)在線交易數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)的一般是歷史數(shù)據(jù)。
數(shù)據(jù)庫(kù)設(shè)計(jì)是盡量避免冗余,一般采用符合范式的規(guī)則來(lái)設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)在設(shè)計(jì)是有意引入冗余,采用反范式的方式來(lái)設(shè)計(jì)。 數(shù)據(jù)庫(kù)是為捕獲數(shù)據(jù)而設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是為分析數(shù)據(jù)而設(shè)計(jì),它的兩個(gè)基本的元素是維表和事實(shí)表。
簡(jiǎn)單的說(shuō):? ?
??? 1、事實(shí)就是你要關(guān)注的內(nèi)容;? ?
??? 2、維度是描述事物特征的一個(gè)角度。例如門(mén)店銷(xiāo)售情況需要分析商品銷(xiāo)售的時(shí)間、地點(diǎn)、商品名等。這里的時(shí)間、地點(diǎn)、商品名就是門(mén)店銷(xiāo)售情況的分析維度。
例如,某地區(qū)商品的銷(xiāo)量,是從地區(qū)這個(gè)角度觀察商品銷(xiāo)量的。事實(shí)表就是銷(xiāo)量表,維表就是地區(qū)表。
1、數(shù)據(jù)倉(cāng)庫(kù)是面向主題的,主題就是所要解決問(wèn)題的領(lǐng)域
2、數(shù)據(jù)倉(cāng)庫(kù)是集成的,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)有來(lái)自于分散的操作型數(shù)據(jù),將所需數(shù)據(jù)從原來(lái)的數(shù)據(jù)中抽取出來(lái),進(jìn)行加工與集成,統(tǒng)一與綜合之后才能進(jìn)入數(shù)據(jù)倉(cāng)庫(kù);
3、相對(duì)穩(wěn)定,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。
4、反映歷史變化
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)
是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的核心,是數(shù)據(jù)存放的地方和提供對(duì)數(shù)據(jù)檢索的支持。相對(duì)于操縱型數(shù)據(jù)庫(kù)來(lái)說(shuō)其突出的特點(diǎn)是對(duì)海量數(shù)據(jù)的支持和快速的檢索技術(shù)。
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)的結(jié)構(gòu)與一般的表結(jié)構(gòu)不一樣
元數(shù)據(jù)
元數(shù)據(jù)是描述數(shù)據(jù)倉(cāng)庫(kù)內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。可將其按用途的不同分為兩類,技術(shù)元數(shù)據(jù)和商業(yè)元數(shù)據(jù)。
數(shù)據(jù)倉(cāng)庫(kù)的解決方法包括:將決策支持型數(shù)據(jù)處理從事務(wù)型數(shù)據(jù)處理中分離出來(lái)。數(shù)據(jù)按照一定的周期(通常在每晚或者每周末),從事務(wù)型數(shù)據(jù)庫(kù)中導(dǎo)入決策支持型數(shù)據(jù)庫(kù)——既“數(shù)據(jù)倉(cāng)庫(kù)”。數(shù)據(jù)倉(cāng)庫(kù)是按回答企業(yè)某方面的問(wèn)題來(lái)分“主題”組織數(shù)據(jù)的,這是最有效的數(shù)據(jù)組織方式。
信息化的實(shí)施,是沒(méi)有終點(diǎn)的,它是一個(gè)持續(xù)優(yōu)化的過(guò)程,BI的實(shí)施,尤其如此。隨著業(yè)務(wù)系統(tǒng)的深入應(yīng)用,流程會(huì)發(fā)生變化;隨著管理的側(cè)重點(diǎn)不同,領(lǐng)導(dǎo)關(guān)注的數(shù)據(jù)也會(huì)不同。這都需要重新修改數(shù)據(jù)倉(cāng)庫(kù)與分析模型
關(guān)鍵詞一:時(shí)間維度
時(shí)間維度雖是數(shù)據(jù)倉(cāng)庫(kù)中的最核心的維度之一,但表面上來(lái)看,僅是日期而已,是非常簡(jiǎn)單的。很容易忽略一個(gè)很常見(jiàn)的問(wèn)題:對(duì)于企業(yè)來(lái)說(shuō),通常會(huì)有兩種時(shí)間:一種是自然日歷時(shí)間,另一種則是財(cái)務(wù)使用的會(huì)計(jì)時(shí)間。有很多企業(yè),因?yàn)樯鲜械脑?,采取某個(gè)4月1日至第二年3月31日來(lái)定義財(cái)年,或因?yàn)闅v史的習(xí)慣,每個(gè)月從26號(hào)到次月的25日為會(huì)計(jì)期間。在操作中,業(yè)務(wù)部門(mén)肯定是按自然時(shí)間來(lái)錄入與查詢信息,而財(cái)務(wù)部門(mén)則按照會(huì)計(jì)時(shí)間來(lái)進(jìn)行記賬與出報(bào)表,在這種情況下,就需要建立一種規(guī)則,來(lái)識(shí)別自然時(shí)間與會(huì)計(jì)時(shí)間的對(duì)應(yīng)關(guān)系。
關(guān)鍵詞三:增量更新
數(shù)據(jù)倉(cāng)庫(kù)的創(chuàng)建不是一次完成的,它必然要根據(jù)業(yè)務(wù)系統(tǒng)數(shù)據(jù)的更新而更新。如何實(shí)現(xiàn)增量更新?這是建立數(shù)據(jù)倉(cāng)庫(kù)時(shí)最大的技術(shù)難點(diǎn)。增量更新意味著它必須識(shí)別哪些數(shù)據(jù)發(fā)生過(guò)變化?如增加/修改了哪些客戶資料?增加/修改了哪些訂單?
數(shù)據(jù)倉(cāng)庫(kù)中的三種事實(shí)表
Transaction fact table(事務(wù)事實(shí)表),比如交易記錄,
Periodic snapshot fact table(周期快照事實(shí)表),我覺(jué)得月累,年累就是屬于這種類型
Accumulating snapshot fact table(累積快照事實(shí)表)累積快照事實(shí)表和周期快照事實(shí)表有些相似之處,它們存儲(chǔ)的都是事務(wù)數(shù)據(jù)的快照信息。但是它們之間也有著很大的不同,周期快照事實(shí)表記錄的確定的周期的數(shù)據(jù),而累積快照事實(shí)表記錄的不確定的周期的數(shù)據(jù).對(duì)這個(gè)似懂非懂。
由于事實(shí)是一種度量,所以事實(shí)表中的這種指標(biāo)往往需要具有數(shù)值化和可加性的特征。但是在事實(shí)表中,只有那些具有完全可加性的事實(shí)才能根據(jù)所有的維度進(jìn)行累加而具有意義。而事實(shí)表有一些事實(shí)表示的是某種強(qiáng)度,這類事實(shí)就不具有完全加法性,而是一種半加法性。例如,賬目余款反映的是某個(gè)時(shí)間點(diǎn)的數(shù)據(jù),它可以按照地點(diǎn)和商品等大多數(shù)維度進(jìn)行累加,但是對(duì)于時(shí)間維度則例外,將一年中每個(gè)月的賬目余款進(jìn)行累加是毫無(wú)意義的,而決策者則可能需要了解所有地區(qū)和所有商品賬目余款的累加值。在事實(shí)表中還有一些事實(shí)是非加法性的,即這些事實(shí)具有對(duì)事實(shí)的描述特性,在這種情況下一般要將這些非加法性事實(shí)轉(zhuǎn)移到維度表中。
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市
數(shù)據(jù)倉(cāng)庫(kù)是企業(yè)級(jí)的,能為整個(gè)企業(yè)各個(gè)部門(mén)的運(yùn)行提供決策支持手段;而數(shù)據(jù)集市則是一種微型的數(shù)據(jù)倉(cāng)庫(kù),它通常有更少的數(shù)據(jù),更少的主題區(qū)域,以及更少的歷史數(shù)據(jù),一般只能為某個(gè)局部范圍內(nèi)的管理人員服務(wù),因此也稱之為部門(mén)級(jí)(工作組級(jí))數(shù)據(jù)倉(cāng)庫(kù)。
數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)結(jié)構(gòu)采用規(guī)范化結(jié)構(gòu)(第三范式),數(shù)據(jù)集市中的數(shù)據(jù)結(jié)構(gòu)采用星型模式或雪片模式,通常倉(cāng)庫(kù)中數(shù)據(jù)粒度比集市的粒度要細(xì)
http://www.chinabi.net/blog/user1/105/archives/2006/388.html
http://blog.csdn.net/dreamwdt/archive/2008/03/19 /2197084.aspx
參考:
http://www.aygfsteel.com/sterning/archive/2007/12/14/167739.html
http://book.51cto.com/art/200710/58849.htm等
數(shù)據(jù)庫(kù)是面向事務(wù)的設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是面向主題設(shè)計(jì)的。
數(shù)據(jù)庫(kù)一般存儲(chǔ)在線交易數(shù)據(jù),數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)的一般是歷史數(shù)據(jù)。
數(shù)據(jù)庫(kù)設(shè)計(jì)是盡量避免冗余,一般采用符合范式的規(guī)則來(lái)設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)在設(shè)計(jì)是有意引入冗余,采用反范式的方式來(lái)設(shè)計(jì)。 數(shù)據(jù)庫(kù)是為捕獲數(shù)據(jù)而設(shè)計(jì),數(shù)據(jù)倉(cāng)庫(kù)是為分析數(shù)據(jù)而設(shè)計(jì),它的兩個(gè)基本的元素是維表和事實(shí)表。
簡(jiǎn)單的說(shuō):? ?
??? 1、事實(shí)就是你要關(guān)注的內(nèi)容;? ?
??? 2、維度是描述事物特征的一個(gè)角度。例如門(mén)店銷(xiāo)售情況需要分析商品銷(xiāo)售的時(shí)間、地點(diǎn)、商品名等。這里的時(shí)間、地點(diǎn)、商品名就是門(mén)店銷(xiāo)售情況的分析維度。
例如,某地區(qū)商品的銷(xiāo)量,是從地區(qū)這個(gè)角度觀察商品銷(xiāo)量的。事實(shí)表就是銷(xiāo)量表,維表就是地區(qū)表。
1、數(shù)據(jù)倉(cāng)庫(kù)是面向主題的,主題就是所要解決問(wèn)題的領(lǐng)域
2、數(shù)據(jù)倉(cāng)庫(kù)是集成的,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)有來(lái)自于分散的操作型數(shù)據(jù),將所需數(shù)據(jù)從原來(lái)的數(shù)據(jù)中抽取出來(lái),進(jìn)行加工與集成,統(tǒng)一與綜合之后才能進(jìn)入數(shù)據(jù)倉(cāng)庫(kù);
3、相對(duì)穩(wěn)定,數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)主要供企業(yè)決策分析之用,所涉及的數(shù)據(jù)操作主要是數(shù)據(jù)查詢,一旦某個(gè)數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)以后,一般情況下將被長(zhǎng)期保留,也就是數(shù)據(jù)倉(cāng)庫(kù)中一般有大量的查詢操作,但修改和刪除操作很少,通常只需要定期的加載、刷新。
4、反映歷史變化
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)
是整個(gè)數(shù)據(jù)倉(cāng)庫(kù)環(huán)境的核心,是數(shù)據(jù)存放的地方和提供對(duì)數(shù)據(jù)檢索的支持。相對(duì)于操縱型數(shù)據(jù)庫(kù)來(lái)說(shuō)其突出的特點(diǎn)是對(duì)海量數(shù)據(jù)的支持和快速的檢索技術(shù)。
數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)庫(kù)的結(jié)構(gòu)與一般的表結(jié)構(gòu)不一樣
元數(shù)據(jù)
元數(shù)據(jù)是描述數(shù)據(jù)倉(cāng)庫(kù)內(nèi)數(shù)據(jù)的結(jié)構(gòu)和建立方法的數(shù)據(jù)。可將其按用途的不同分為兩類,技術(shù)元數(shù)據(jù)和商業(yè)元數(shù)據(jù)。
數(shù)據(jù)倉(cāng)庫(kù)的解決方法包括:將決策支持型數(shù)據(jù)處理從事務(wù)型數(shù)據(jù)處理中分離出來(lái)。數(shù)據(jù)按照一定的周期(通常在每晚或者每周末),從事務(wù)型數(shù)據(jù)庫(kù)中導(dǎo)入決策支持型數(shù)據(jù)庫(kù)——既“數(shù)據(jù)倉(cāng)庫(kù)”。數(shù)據(jù)倉(cāng)庫(kù)是按回答企業(yè)某方面的問(wèn)題來(lái)分“主題”組織數(shù)據(jù)的,這是最有效的數(shù)據(jù)組織方式。
信息化的實(shí)施,是沒(méi)有終點(diǎn)的,它是一個(gè)持續(xù)優(yōu)化的過(guò)程,BI的實(shí)施,尤其如此。隨著業(yè)務(wù)系統(tǒng)的深入應(yīng)用,流程會(huì)發(fā)生變化;隨著管理的側(cè)重點(diǎn)不同,領(lǐng)導(dǎo)關(guān)注的數(shù)據(jù)也會(huì)不同。這都需要重新修改數(shù)據(jù)倉(cāng)庫(kù)與分析模型
關(guān)鍵詞一:時(shí)間維度
時(shí)間維度雖是數(shù)據(jù)倉(cāng)庫(kù)中的最核心的維度之一,但表面上來(lái)看,僅是日期而已,是非常簡(jiǎn)單的。很容易忽略一個(gè)很常見(jiàn)的問(wèn)題:對(duì)于企業(yè)來(lái)說(shuō),通常會(huì)有兩種時(shí)間:一種是自然日歷時(shí)間,另一種則是財(cái)務(wù)使用的會(huì)計(jì)時(shí)間。有很多企業(yè),因?yàn)樯鲜械脑?,采取某個(gè)4月1日至第二年3月31日來(lái)定義財(cái)年,或因?yàn)闅v史的習(xí)慣,每個(gè)月從26號(hào)到次月的25日為會(huì)計(jì)期間。在操作中,業(yè)務(wù)部門(mén)肯定是按自然時(shí)間來(lái)錄入與查詢信息,而財(cái)務(wù)部門(mén)則按照會(huì)計(jì)時(shí)間來(lái)進(jìn)行記賬與出報(bào)表,在這種情況下,就需要建立一種規(guī)則,來(lái)識(shí)別自然時(shí)間與會(huì)計(jì)時(shí)間的對(duì)應(yīng)關(guān)系。
關(guān)鍵詞三:增量更新
數(shù)據(jù)倉(cāng)庫(kù)的創(chuàng)建不是一次完成的,它必然要根據(jù)業(yè)務(wù)系統(tǒng)數(shù)據(jù)的更新而更新。如何實(shí)現(xiàn)增量更新?這是建立數(shù)據(jù)倉(cāng)庫(kù)時(shí)最大的技術(shù)難點(diǎn)。增量更新意味著它必須識(shí)別哪些數(shù)據(jù)發(fā)生過(guò)變化?如增加/修改了哪些客戶資料?增加/修改了哪些訂單?
數(shù)據(jù)倉(cāng)庫(kù)中的三種事實(shí)表
Transaction fact table(事務(wù)事實(shí)表),比如交易記錄,
Periodic snapshot fact table(周期快照事實(shí)表),我覺(jué)得月累,年累就是屬于這種類型
Accumulating snapshot fact table(累積快照事實(shí)表)累積快照事實(shí)表和周期快照事實(shí)表有些相似之處,它們存儲(chǔ)的都是事務(wù)數(shù)據(jù)的快照信息。但是它們之間也有著很大的不同,周期快照事實(shí)表記錄的確定的周期的數(shù)據(jù),而累積快照事實(shí)表記錄的不確定的周期的數(shù)據(jù).對(duì)這個(gè)似懂非懂。
由于事實(shí)是一種度量,所以事實(shí)表中的這種指標(biāo)往往需要具有數(shù)值化和可加性的特征。但是在事實(shí)表中,只有那些具有完全可加性的事實(shí)才能根據(jù)所有的維度進(jìn)行累加而具有意義。而事實(shí)表有一些事實(shí)表示的是某種強(qiáng)度,這類事實(shí)就不具有完全加法性,而是一種半加法性。例如,賬目余款反映的是某個(gè)時(shí)間點(diǎn)的數(shù)據(jù),它可以按照地點(diǎn)和商品等大多數(shù)維度進(jìn)行累加,但是對(duì)于時(shí)間維度則例外,將一年中每個(gè)月的賬目余款進(jìn)行累加是毫無(wú)意義的,而決策者則可能需要了解所有地區(qū)和所有商品賬目余款的累加值。在事實(shí)表中還有一些事實(shí)是非加法性的,即這些事實(shí)具有對(duì)事實(shí)的描述特性,在這種情況下一般要將這些非加法性事實(shí)轉(zhuǎn)移到維度表中。
數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)集市
數(shù)據(jù)倉(cāng)庫(kù)是企業(yè)級(jí)的,能為整個(gè)企業(yè)各個(gè)部門(mén)的運(yùn)行提供決策支持手段;而數(shù)據(jù)集市則是一種微型的數(shù)據(jù)倉(cāng)庫(kù),它通常有更少的數(shù)據(jù),更少的主題區(qū)域,以及更少的歷史數(shù)據(jù),一般只能為某個(gè)局部范圍內(nèi)的管理人員服務(wù),因此也稱之為部門(mén)級(jí)(工作組級(jí))數(shù)據(jù)倉(cāng)庫(kù)。
數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)結(jié)構(gòu)采用規(guī)范化結(jié)構(gòu)(第三范式),數(shù)據(jù)集市中的數(shù)據(jù)結(jié)構(gòu)采用星型模式或雪片模式,通常倉(cāng)庫(kù)中數(shù)據(jù)粒度比集市的粒度要細(xì)
http://www.chinabi.net/blog/user1/105/archives/2006/388.html
http://blog.csdn.net/dreamwdt/archive/2008/03/19 /2197084.aspx
參考:
http://www.aygfsteel.com/sterning/archive/2007/12/14/167739.html
http://book.51cto.com/art/200710/58849.htm等