數據倉庫(Data Warehouse)是一個面向主題的(Subject Oriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(Time Variant)的數據集合,用于支持管理決策。

所謂的(1) 面向主題:指數據倉庫中的數據是按照一定的主題域進行組織。

(2)集成:指對原有分散的數據庫數據經過系統加工, 整理得到的消除源數據中的不一致性。

(3)相對穩定:指一旦某個數據進入數據倉庫以后只需要定期的加載、刷新

(4)反映歷史變化:指通過這些信息,對企業的發展歷程和未來趨勢做出定量分析預測

數據倉庫建設是一個工程,是一個過程,而不是一種可以購買的產品。企業數據處理方式是以聯機事務處理形式信息,并利用信息進行決策;在信息應用過程中管理信息。

 數據倉庫的出現,并不是要取代數據庫。目前,大部分數據倉庫還是用關系數據庫管

理系統來管理的。數據倉庫與數據庫的主要區別在于:

(1)數據庫是面向事務的設計,數據倉庫是面向主題設計的。

(2)數據庫一般存儲在線交易數據,數據倉庫存儲的一般是歷史數據。 

(3)數據庫設計是盡量避免冗余,數據倉庫在設計是有意引入冗余。 

(4)數據庫是為捕獲數據而設計,數據倉庫是為分析數據而設計。



from http://io.sit.edu.cn/s/8/t/157/3c/16/info15382.htm 上海應用技術學院