目?? 錄
A. 快速建庫方法論瀏覽
1.什么是數(shù)據(jù)倉庫
2.建立數(shù)據(jù)倉庫的業(yè)務(wù)理由
3.建立數(shù)據(jù)倉庫的技術(shù)理由
4.?dāng)?shù)據(jù)倉庫的技術(shù)特征
5.確認(rèn)業(yè)務(wù)需要和數(shù)據(jù)倉庫的目標(biāo)
6.關(guān)鍵成功因素
B. SAS快速建立數(shù)據(jù)倉庫方法論的細(xì)節(jié)
1.業(yè)務(wù)驅(qū)動
2.收集需求的研討會
3.快速應(yīng)用開發(fā) (RAD)
C.方法論的框架
--------------------------------------------------------------------------------
A. 快速建庫方法論瀏覽
????一個企業(yè)在開發(fā)和實施數(shù)據(jù)倉庫時,使用一個高效和經(jīng)驗證的方法論是關(guān)鍵的,這一點已是十分清楚的了。考慮到這一點,多年來SAS研究、發(fā)展和改進了經(jīng)驗證的實施數(shù)據(jù)倉庫的方法論,我們稱之為快速建庫方法論。本文件的這一節(jié)將描述這個方法論。
1.什么是數(shù)據(jù)倉庫?
????一個數(shù)據(jù)倉庫通常是一個分散的數(shù)據(jù)存儲,在其中信息是存為這樣的一種形式,它適合于業(yè)務(wù)智能化和決策支持系統(tǒng)。數(shù)據(jù)可能是以不同形式存儲的,它并不影響OLTP系統(tǒng)的運作。
????數(shù)據(jù)倉庫的建立是用一種循環(huán)的逐步完善的過程而不是一步完善的。數(shù)據(jù)倉庫通常是與解決企業(yè)不斷改變的組織問題的全過程有關(guān)。
????數(shù)據(jù)倉庫通常是圍繞主題建立的。主題就是企業(yè)感興趣的論題,比如部門、活動和操作結(jié)果。數(shù)據(jù)倉庫的結(jié)構(gòu)是由數(shù)據(jù)倉庫應(yīng)滿足的應(yīng)用決定的。快速提交信息是成功實施數(shù)據(jù)倉庫的關(guān)鍵。由于這一點,就引入了象數(shù)據(jù)集市和信息集市這些概念。數(shù)據(jù)集市是數(shù)據(jù)倉庫的一個子集,它通常更為概括,以滿足對關(guān)心數(shù)據(jù)的查詢有比數(shù)據(jù)倉庫本身更快的速度。信息集市存儲可用視窗器(viewer)顯示的預(yù)處理的信息。
????在信息集市中常包含以下幾類信息:
報告輸出(打印的文本、圖形等)
多媒體介質(zhì) (錄象和錄音)內(nèi)容的記錄
電子表單
2.建立數(shù)據(jù)倉庫的業(yè)務(wù)理由
????數(shù)據(jù)倉庫為管理者和業(yè)務(wù)用戶提供真正決策支持的基礎(chǔ)。企業(yè)為這些業(yè)務(wù)用戶存儲了多年的信息,但是數(shù)據(jù)倉庫提供專為他們設(shè)計的有構(gòu)架的信息。數(shù)據(jù)倉庫實施的最初階段往往要解決現(xiàn)成的業(yè)務(wù)問題(即較為被動的),而以后的實施常是更為主動的。數(shù)據(jù)倉庫的一個強項是它支持對數(shù)據(jù)的隨時需要的查詢和進行未計劃的數(shù)據(jù)探索的需要。就是說,數(shù)據(jù)倉庫給業(yè)務(wù)用戶以不同方法分析數(shù)據(jù)的能力和自由度,而不受預(yù)先設(shè)定的一組報告的限制。
3.建立數(shù)據(jù)倉庫的技術(shù)理由
??????建立數(shù)據(jù)倉庫最共同的技術(shù)理由是企業(yè)現(xiàn)用的信息技術(shù)結(jié)構(gòu)不能滿意地滿足業(yè)務(wù)需要。過去,信息技術(shù)集中于運作系統(tǒng),它保證業(yè)務(wù)過程運行所必須的任務(wù)的自動化。但是,運作系統(tǒng)一般不能很好地滿足決策支持的需要。一個運作系統(tǒng)典型的有多個事務(wù)處理(transaction)的應(yīng)用構(gòu)成,每個應(yīng)用使部門的一個過程和功能自動化。在運作系統(tǒng)中,每個事務(wù)和每一分鐘的業(yè)務(wù)細(xì)節(jié)都記錄在與事務(wù)應(yīng)用關(guān)聯(lián)的數(shù)據(jù)庫中。
???? 事務(wù)系統(tǒng)的設(shè)計要考慮將部門運作需要的細(xì)節(jié)信息有效地進入系統(tǒng)。有效性的要求導(dǎo)致應(yīng)用開發(fā)者實現(xiàn)高度規(guī)范的數(shù)據(jù)和在存檔發(fā)生之前就必須決定作為應(yīng)用的一部分有多少數(shù)據(jù)可存儲。雖然運作系統(tǒng)對日常業(yè)務(wù)活的支持是非常有效的,但他們對于運用常規(guī)的軟件技術(shù)支持報表制作、決策和行政信息系統(tǒng)并不是很好的。他們的側(cè)重點是在數(shù)據(jù)的存儲,很少提供訪問數(shù)據(jù)和將數(shù)據(jù)變?yōu)橛杏脹Q策信息的工具。
???? 運作系統(tǒng)和數(shù)據(jù)倉庫是完全不同的。內(nèi)容是不同的,結(jié)構(gòu)是不同的,硬件和軟件的需求是不同的,管理是不同的和用戶是不同的。數(shù)據(jù)倉庫的存儲是設(shè)計得能提供決策支持信息的。它由業(yè)務(wù)應(yīng)用數(shù)據(jù)來構(gòu)建,但數(shù)據(jù)要先經(jīng)過提取,再進行過濾、校驗并組織到反映單位需要的主題中去。
???? 數(shù)據(jù)倉庫的數(shù)據(jù)是經(jīng)過一段時間的收集,并用于比較、趨勢分析和預(yù)測的。
????若用運作系統(tǒng)存儲的數(shù)據(jù)做決策支持,將會遇到以下的一些問題:
決策要求對歷史數(shù)據(jù)進行比較、趨勢分析和預(yù)測。這些信息通常在運作系統(tǒng)中是無法得到的。
數(shù)據(jù)必須從運作數(shù)據(jù)存區(qū)中提取。隨著時間推移,這些提取也增長和擴大。數(shù)據(jù)的可靠性、有效性和通用性都是無法確定的,因為創(chuàng)建各種分析需要的復(fù)本時已生成了原始數(shù)據(jù)源的多個復(fù)本和多個不同水平的數(shù)據(jù)子集。
在運作系統(tǒng)中的數(shù)據(jù)是按一個特殊的活動而格式化的,它并不考慮單位決策的需要。從多個運作數(shù)據(jù)庫中得到的數(shù)據(jù)需要提取和處理,這使得很難顧及單位的要求。為了作出可靠的業(yè)務(wù)決策或者回答簡單的業(yè)務(wù)問題,分析工作者必須花費大量的時間從不同的數(shù)據(jù)源中局部化或整合有關(guān)的信息。
運作系統(tǒng)是經(jīng)常更新的。當(dāng)數(shù)據(jù)經(jīng)常改變時,就難于對企業(yè)的問題作出一致的回答。而回答的經(jīng)常改變會混淆決策過程。
運作系統(tǒng)對大量細(xì)小的事務(wù)進行優(yōu)化。常常一個查詢導(dǎo)致另一個查詢。業(yè)務(wù)用戶活動的重復(fù)本質(zhì)以及處理大量數(shù)據(jù)的需要與運作數(shù)據(jù)庫的設(shè)計、目的是沖突的。
????很多企業(yè)試圖用訪問數(shù)據(jù)和提取數(shù)據(jù)的軟件工具從運作系統(tǒng)獲得決策支持的數(shù)據(jù),有成功的也有不成功的。無論如何,即便使用這些工具,運作系統(tǒng)和決策支持設(shè)計固有的矛盾總是存在的。數(shù)據(jù)倉庫按其定義消除了上述的問題。事實上,這些問題幫助我們確定數(shù)據(jù)倉庫的技術(shù)特征。
4.?dāng)?shù)據(jù)倉庫的技術(shù)特征
????數(shù)據(jù)倉庫的技術(shù)特征如下:
數(shù)據(jù)倉庫的數(shù)據(jù)不是多變的。這意味著不同人員對同一信息的需求將獲得相同的回答。這也意味著在您分析的過程中數(shù)據(jù)不會改變。 數(shù)據(jù)倉庫的數(shù)據(jù)裝載是適時和可用于預(yù)測的。
數(shù)據(jù)倉庫反映企業(yè)機構(gòu)組織的需要。數(shù)據(jù)倉庫的構(gòu)件是直接反映您們單位的主題。這些主題規(guī)定得可滿足企業(yè)的需要而不管運作系統(tǒng)的要求。
數(shù)據(jù)倉庫是整合的。所有業(yè)務(wù)系統(tǒng)的有價值信息都要整合到數(shù)據(jù)倉庫的主題中去。多個業(yè)務(wù)數(shù)據(jù)源數(shù)據(jù)的差別應(yīng)該在裝載到數(shù)據(jù)倉庫之前進行協(xié)調(diào)。
數(shù)據(jù)倉庫提供企業(yè)的歷史回顧。多年的數(shù)據(jù)常以匯總的方式加以存儲。與此對照的,典型的業(yè)務(wù)應(yīng)用只存儲一個較短時段的數(shù)據(jù)。
數(shù)據(jù)倉庫對查詢功能是優(yōu)化的。優(yōu)化通常需要對數(shù)據(jù)預(yù)匯總,預(yù)索引和預(yù)取子集。將數(shù)據(jù)分隔和組合為許多可能的組合(分片和切塊)的能力和有效地反復(fù)查詢大量數(shù)據(jù)的能力是數(shù)據(jù)倉庫的基本要求。
最后,數(shù)據(jù)倉庫必須與分析工具項匹配。裝載和維護數(shù)據(jù)倉庫只是過程的一部分。一個數(shù)據(jù)倉庫只有具備了輔助的決策支持工具時才是完善的,這一決策支持工具應(yīng)反映和利用數(shù)據(jù)倉庫的結(jié)構(gòu)。
5.確認(rèn)業(yè)務(wù)需要和數(shù)據(jù)倉庫的目標(biāo)
????如同已經(jīng)看到的,使用數(shù)據(jù)倉庫技術(shù)有清楚的技術(shù)理由。但是,清晰地設(shè)定數(shù)據(jù)倉庫要實現(xiàn)的業(yè)務(wù)需要和用以評價數(shù)據(jù)倉庫成功的標(biāo)準(zhǔn)這兩者同樣是十分重要的。在大部分情形,數(shù)據(jù)倉庫是為業(yè)務(wù)部門建立的。所以數(shù)據(jù)倉庫的成功依賴于對業(yè)務(wù)部門需求的了解。由于這一點,由業(yè)務(wù)部門確定數(shù)據(jù)倉庫的內(nèi)容是必須的。
????SAS快速建庫方法論也提供問卷和過程,它幫助企業(yè)確定數(shù)據(jù)倉庫內(nèi)容和構(gòu)架。它也幫助企業(yè)確定評價準(zhǔn)則和清楚地界定數(shù)據(jù)倉庫項目。清楚地明白企業(yè)的需要和目標(biāo)也將幫助說明數(shù)據(jù)倉庫項目與企業(yè)的關(guān)系以及數(shù)據(jù)倉庫的作用和企業(yè)成功的關(guān)系。
6.關(guān)鍵成功因素
????除了對企業(yè)的業(yè)務(wù)需求和數(shù)據(jù)倉庫目的有一個清晰的了解外,還需要采取下列步驟確保數(shù)據(jù)倉庫項目滿足這些需要和目標(biāo):
選擇公司可能的最高人員負(fù)責(zé)數(shù)據(jù)倉庫項目。他對項目成功負(fù)有全職。組成包括業(yè)務(wù)決策者和IT專家的跨部門項目組。數(shù)據(jù)倉庫成功的一個關(guān)鍵是業(yè)務(wù)專家和IT專家的密切合作,它將保證數(shù)據(jù)倉庫項目的各個方面都被顧及到。
獲取項目成功所需要的資源投資的承諾。
項目擁有權(quán)的一致意見。
項目評價標(biāo)準(zhǔn)的一致意見。
確保業(yè)務(wù)部門與IT部門一致地為項目成功進行努力。
選擇可以提供數(shù)據(jù)倉庫完整解決方案的可靠和有能力的伙伴。
若實施一個企業(yè)的數(shù)據(jù)倉庫,應(yīng)該在完成第一循環(huán)或項目的模塊后,讓單位的其他成員知道其成功。若這一循環(huán)正確地實現(xiàn)了,其成功應(yīng)該讓有關(guān)的每個人員清楚地看到,因為它是可見的且直接關(guān)系到企業(yè)的目標(biāo)。回到列舉企業(yè)任務(wù)和處理的清單并從新確定其優(yōu)先程度。再選擇擴展數(shù)據(jù)倉庫的下一個項目。
B. SAS快速建立數(shù)據(jù)倉庫方法論的細(xì)節(jié)
????數(shù)據(jù)倉庫建立的過程一直還是比較新的,還缺少實踐經(jīng)驗,并不為IT業(yè)界廣泛了解。此外,數(shù)據(jù)倉庫常是這樣的一個項目,它與單位的許多部門交叉,要求額外的計劃,交流和管理。在這些情況下,最好汲取其它方面的經(jīng)驗并遵循一個合理、經(jīng)驗證的方法論。
????至此,SAS研究所開發(fā)的SAS快速建庫方法論幫助企業(yè)開發(fā)一個高質(zhì)量數(shù)據(jù)倉庫,它可以在預(yù)算的范圍內(nèi)按時地滿足甚至超過用戶的需要和期望。它提供一個檢驗數(shù)據(jù)倉庫開發(fā)和實施是否成功的測試框架。它是基于SAS研究所的咨詢專家、合作伙伴和用戶的最佳實踐和經(jīng)驗教訓(xùn),這些專家成功地實施了數(shù)據(jù)倉庫。這一方法論提供了經(jīng)驗證的建庫框架,包括過程、問卷、工作表單和模板。若企業(yè)自己開發(fā)這些,將是耗時和難于管理的。運用SAS的快速建庫方法論,在實施數(shù)據(jù)倉庫的往復(fù)循環(huán)的各階段會快速地遞交結(jié)果,使得在一個很短的時間段內(nèi)達到一個可量化的結(jié)果。方法輪是運用快速應(yīng)用開發(fā)和SAS系統(tǒng)原型技術(shù)的一個分段式的處理。這是一個整合的,業(yè)務(wù)驅(qū)動的處理:各用戶部門在實施的各階段都有重要的輸入,為報告和分析目的而逐步但快速增長地使用數(shù)據(jù)倉庫,對此IT部門應(yīng)當(dāng)有準(zhǔn)備。
????SAS系統(tǒng)提供的工具(例智能化的客戶機/服務(wù)器,多廠商構(gòu)架等)可以幫助企業(yè)實現(xiàn)一個靈活和低風(fēng)險的處理。相對于數(shù)據(jù)倉庫對企業(yè)的潛在回報,過程的每一步的投入(過程資源、開發(fā)人員和工作人員等)是非常低的。
????使得SAS快速建庫方法論成功的三個主要因素是:
業(yè)務(wù)或用戶的關(guān)注;
細(xì)致的收集用戶需求和項目界定的研討會;
使用快速應(yīng)用開發(fā)(RAD)處理。
????這些特點在下一節(jié)討論。
1.業(yè)務(wù)驅(qū)動
????SAS 快速建庫的方法論是一個高度地以業(yè)務(wù)為驅(qū)動的過程:
了解數(shù)據(jù)倉庫的需要和將從數(shù)據(jù)倉庫中獲益的業(yè)務(wù)管理者必須參加。
業(yè)務(wù)用戶都是項目組的成員。使用有用的技術(shù)收集、建立文檔和改善關(guān)于項目參加者需求的信息。
度量項目業(yè)務(wù)得益的信息應(yīng)在項目的早期階段就加以收集。
重點是放在評估由數(shù)據(jù)倉庫得到的業(yè)務(wù)效益和投資回報。
2.收集需求的研討會
????研討會確立象目標(biāo)、范圍和優(yōu)先這樣一些項目的高水平要素。這些是重要的,因為數(shù)據(jù)倉庫項目要影響許多不同的業(yè)務(wù)領(lǐng)域,這些領(lǐng)域會有不同的優(yōu)先程度。研討會也可以縮短完成項目所需要的時間,因為它使人們聚集在一起,可減少個別交談收集信息的反復(fù)次數(shù)。
3.快速應(yīng)用開發(fā) (RAD)
????一個 RAD循環(huán)是對SAS 快速建庫方法論本質(zhì)的一個寫照,因為需要盡快第看到他們努力的結(jié)果。快速應(yīng)用開發(fā)基于反復(fù)發(fā)展的循環(huán)。即將一個大項目分為小項目,或"構(gòu)件",在此每個構(gòu)件服務(wù)于單個操作單元或功能區(qū)域的信息需要。每個構(gòu)件是一個功能的可管理的單元,是易于理解和可以快速向企業(yè)顯示價值的。
????運用 RAD 可以使項目開發(fā)組為企業(yè)用戶設(shè)定項目的優(yōu)先,為每個構(gòu)件設(shè)定主題以及為每個子項目清楚地劃定范圍。當(dāng)每個局部任務(wù)完成后,會提出和明確進一步的需求。
????循環(huán)式的處理有如下的好處:
有利于應(yīng)用維護。
改進適應(yīng)需求改變的能力。
減小無法管理項目的風(fēng)險。
及早提供用戶的反饋。
及早提交用戶的可度量的好處。
提交高質(zhì)量的解決方案。
及早提供結(jié)果。
C.方法論的框架
????SAS快速建庫的方法論典型地分為概括如下的6步。這些步驟提供工作的邏輯分段和檢驗項目是否建立在一個堅實的基礎(chǔ)上。評估、需求調(diào)查和總結(jié)階段著眼于確認(rèn)、理解和回顧項目目標(biāo)和單位的目標(biāo)。設(shè)計、構(gòu)建和部署階段基于使用RAD 手段設(shè)計、開發(fā)和配置數(shù)據(jù)倉庫環(huán)境。以下的流程圖提供了方法論各個階段的一個總貌和流程。
SAS 快速建庫方法論的各個階段在以下各節(jié)描述。
1.評估階段
????在評估階段,對影響要求解決方案的用戶的現(xiàn)有情況和條件進行了解。了解的目的是分析用戶的問題和解決它的辦法。最初的評估要確認(rèn)和澄清目標(biāo),確認(rèn)為澄清目標(biāo)所做的研究的任何需要,這一評估將導(dǎo)致建議開始、延遲或取消這個項目。確定初始階段項目組的成員和項目范圍、作用和主要的提交結(jié)果。
2.需求調(diào)查階段
????在需求調(diào)查階段,項目組收集業(yè)務(wù)和IT方面的高水平要求。對部門目標(biāo)和信息需求的信息進行收集。本階段的結(jié)果為提交一個報告,這個報告識別業(yè)務(wù)的目的、意義、信息要求和用戶界面。這些需求也將用于數(shù)據(jù)倉庫設(shè)計和項目的其它階段。而且,這個階段完成企業(yè)級的主題數(shù)據(jù)模型和數(shù)據(jù)倉庫主題的選取。與收集業(yè)務(wù)需求的同時,IT需求的調(diào)研也同步地進行。并對主題驅(qū)動數(shù)據(jù)倉庫的IT要求進行分析。
3.設(shè)計階段
????在選取主題方面,項目組集中于收集詳細(xì)的信息要求和設(shè)計數(shù)據(jù)倉庫構(gòu)架,包括數(shù)據(jù),過程和應(yīng)用模型。在這一階段,使用各種信息收集和驗證的手段,包括數(shù)據(jù)建模、過程建模、座談和原型展示。項目組評價技術(shù)構(gòu)架,業(yè)務(wù)需求和信息需求。現(xiàn)有IT構(gòu)架和要求的IT構(gòu)架之間的差別是突出的,建議采用合適的數(shù)據(jù)倉庫設(shè)計和構(gòu)架。
4.構(gòu)建階段
????在構(gòu)建階段,包括構(gòu)建物理的數(shù)據(jù)倉庫并組裝,應(yīng)用和處理的編碼以及驗收測試。在這一階段數(shù)據(jù)倉庫的管理者和終端用戶的指導(dǎo)者應(yīng)熟悉應(yīng)用。當(dāng)測試成功完成后,數(shù)據(jù)倉庫就交付用戶使用和維護。
5.部署階段
????在部署階段,數(shù)據(jù)倉庫展示給其他業(yè)務(wù)用戶并開始進行使用應(yīng)用的訓(xùn)練。在部署后,數(shù)據(jù)倉庫管理者維護數(shù)據(jù)倉庫。對提出的意見進行必要的修改。
6.總結(jié)階段
????在總結(jié)階段,對項目的成功及其對企業(yè)的作用進行評價。總結(jié)分三步進行。第一步總結(jié)早期項目實施成功和失敗的經(jīng)驗和公布以后努力的結(jié)果。第二步是應(yīng)用配置是否如期望的實現(xiàn)了,如有必要須調(diào)整計劃。第三步評估項目對單位的影響和得益。
A. 快速建庫方法論瀏覽
1.什么是數(shù)據(jù)倉庫
2.建立數(shù)據(jù)倉庫的業(yè)務(wù)理由
3.建立數(shù)據(jù)倉庫的技術(shù)理由
4.?dāng)?shù)據(jù)倉庫的技術(shù)特征
5.確認(rèn)業(yè)務(wù)需要和數(shù)據(jù)倉庫的目標(biāo)
6.關(guān)鍵成功因素
B. SAS快速建立數(shù)據(jù)倉庫方法論的細(xì)節(jié)
1.業(yè)務(wù)驅(qū)動
2.收集需求的研討會
3.快速應(yīng)用開發(fā) (RAD)
C.方法論的框架
--------------------------------------------------------------------------------
A. 快速建庫方法論瀏覽
????一個企業(yè)在開發(fā)和實施數(shù)據(jù)倉庫時,使用一個高效和經(jīng)驗證的方法論是關(guān)鍵的,這一點已是十分清楚的了。考慮到這一點,多年來SAS研究、發(fā)展和改進了經(jīng)驗證的實施數(shù)據(jù)倉庫的方法論,我們稱之為快速建庫方法論。本文件的這一節(jié)將描述這個方法論。
1.什么是數(shù)據(jù)倉庫?
????一個數(shù)據(jù)倉庫通常是一個分散的數(shù)據(jù)存儲,在其中信息是存為這樣的一種形式,它適合于業(yè)務(wù)智能化和決策支持系統(tǒng)。數(shù)據(jù)可能是以不同形式存儲的,它并不影響OLTP系統(tǒng)的運作。
????數(shù)據(jù)倉庫的建立是用一種循環(huán)的逐步完善的過程而不是一步完善的。數(shù)據(jù)倉庫通常是與解決企業(yè)不斷改變的組織問題的全過程有關(guān)。
????數(shù)據(jù)倉庫通常是圍繞主題建立的。主題就是企業(yè)感興趣的論題,比如部門、活動和操作結(jié)果。數(shù)據(jù)倉庫的結(jié)構(gòu)是由數(shù)據(jù)倉庫應(yīng)滿足的應(yīng)用決定的。快速提交信息是成功實施數(shù)據(jù)倉庫的關(guān)鍵。由于這一點,就引入了象數(shù)據(jù)集市和信息集市這些概念。數(shù)據(jù)集市是數(shù)據(jù)倉庫的一個子集,它通常更為概括,以滿足對關(guān)心數(shù)據(jù)的查詢有比數(shù)據(jù)倉庫本身更快的速度。信息集市存儲可用視窗器(viewer)顯示的預(yù)處理的信息。
????在信息集市中常包含以下幾類信息:
報告輸出(打印的文本、圖形等)
多媒體介質(zhì) (錄象和錄音)內(nèi)容的記錄
電子表單
2.建立數(shù)據(jù)倉庫的業(yè)務(wù)理由
????數(shù)據(jù)倉庫為管理者和業(yè)務(wù)用戶提供真正決策支持的基礎(chǔ)。企業(yè)為這些業(yè)務(wù)用戶存儲了多年的信息,但是數(shù)據(jù)倉庫提供專為他們設(shè)計的有構(gòu)架的信息。數(shù)據(jù)倉庫實施的最初階段往往要解決現(xiàn)成的業(yè)務(wù)問題(即較為被動的),而以后的實施常是更為主動的。數(shù)據(jù)倉庫的一個強項是它支持對數(shù)據(jù)的隨時需要的查詢和進行未計劃的數(shù)據(jù)探索的需要。就是說,數(shù)據(jù)倉庫給業(yè)務(wù)用戶以不同方法分析數(shù)據(jù)的能力和自由度,而不受預(yù)先設(shè)定的一組報告的限制。
3.建立數(shù)據(jù)倉庫的技術(shù)理由
??????建立數(shù)據(jù)倉庫最共同的技術(shù)理由是企業(yè)現(xiàn)用的信息技術(shù)結(jié)構(gòu)不能滿意地滿足業(yè)務(wù)需要。過去,信息技術(shù)集中于運作系統(tǒng),它保證業(yè)務(wù)過程運行所必須的任務(wù)的自動化。但是,運作系統(tǒng)一般不能很好地滿足決策支持的需要。一個運作系統(tǒng)典型的有多個事務(wù)處理(transaction)的應(yīng)用構(gòu)成,每個應(yīng)用使部門的一個過程和功能自動化。在運作系統(tǒng)中,每個事務(wù)和每一分鐘的業(yè)務(wù)細(xì)節(jié)都記錄在與事務(wù)應(yīng)用關(guān)聯(lián)的數(shù)據(jù)庫中。
???? 事務(wù)系統(tǒng)的設(shè)計要考慮將部門運作需要的細(xì)節(jié)信息有效地進入系統(tǒng)。有效性的要求導(dǎo)致應(yīng)用開發(fā)者實現(xiàn)高度規(guī)范的數(shù)據(jù)和在存檔發(fā)生之前就必須決定作為應(yīng)用的一部分有多少數(shù)據(jù)可存儲。雖然運作系統(tǒng)對日常業(yè)務(wù)活的支持是非常有效的,但他們對于運用常規(guī)的軟件技術(shù)支持報表制作、決策和行政信息系統(tǒng)并不是很好的。他們的側(cè)重點是在數(shù)據(jù)的存儲,很少提供訪問數(shù)據(jù)和將數(shù)據(jù)變?yōu)橛杏脹Q策信息的工具。
???? 運作系統(tǒng)和數(shù)據(jù)倉庫是完全不同的。內(nèi)容是不同的,結(jié)構(gòu)是不同的,硬件和軟件的需求是不同的,管理是不同的和用戶是不同的。數(shù)據(jù)倉庫的存儲是設(shè)計得能提供決策支持信息的。它由業(yè)務(wù)應(yīng)用數(shù)據(jù)來構(gòu)建,但數(shù)據(jù)要先經(jīng)過提取,再進行過濾、校驗并組織到反映單位需要的主題中去。
???? 數(shù)據(jù)倉庫的數(shù)據(jù)是經(jīng)過一段時間的收集,并用于比較、趨勢分析和預(yù)測的。
????若用運作系統(tǒng)存儲的數(shù)據(jù)做決策支持,將會遇到以下的一些問題:
決策要求對歷史數(shù)據(jù)進行比較、趨勢分析和預(yù)測。這些信息通常在運作系統(tǒng)中是無法得到的。
數(shù)據(jù)必須從運作數(shù)據(jù)存區(qū)中提取。隨著時間推移,這些提取也增長和擴大。數(shù)據(jù)的可靠性、有效性和通用性都是無法確定的,因為創(chuàng)建各種分析需要的復(fù)本時已生成了原始數(shù)據(jù)源的多個復(fù)本和多個不同水平的數(shù)據(jù)子集。
在運作系統(tǒng)中的數(shù)據(jù)是按一個特殊的活動而格式化的,它并不考慮單位決策的需要。從多個運作數(shù)據(jù)庫中得到的數(shù)據(jù)需要提取和處理,這使得很難顧及單位的要求。為了作出可靠的業(yè)務(wù)決策或者回答簡單的業(yè)務(wù)問題,分析工作者必須花費大量的時間從不同的數(shù)據(jù)源中局部化或整合有關(guān)的信息。
運作系統(tǒng)是經(jīng)常更新的。當(dāng)數(shù)據(jù)經(jīng)常改變時,就難于對企業(yè)的問題作出一致的回答。而回答的經(jīng)常改變會混淆決策過程。
運作系統(tǒng)對大量細(xì)小的事務(wù)進行優(yōu)化。常常一個查詢導(dǎo)致另一個查詢。業(yè)務(wù)用戶活動的重復(fù)本質(zhì)以及處理大量數(shù)據(jù)的需要與運作數(shù)據(jù)庫的設(shè)計、目的是沖突的。
????很多企業(yè)試圖用訪問數(shù)據(jù)和提取數(shù)據(jù)的軟件工具從運作系統(tǒng)獲得決策支持的數(shù)據(jù),有成功的也有不成功的。無論如何,即便使用這些工具,運作系統(tǒng)和決策支持設(shè)計固有的矛盾總是存在的。數(shù)據(jù)倉庫按其定義消除了上述的問題。事實上,這些問題幫助我們確定數(shù)據(jù)倉庫的技術(shù)特征。
4.?dāng)?shù)據(jù)倉庫的技術(shù)特征
????數(shù)據(jù)倉庫的技術(shù)特征如下:
數(shù)據(jù)倉庫的數(shù)據(jù)不是多變的。這意味著不同人員對同一信息的需求將獲得相同的回答。這也意味著在您分析的過程中數(shù)據(jù)不會改變。 數(shù)據(jù)倉庫的數(shù)據(jù)裝載是適時和可用于預(yù)測的。
數(shù)據(jù)倉庫反映企業(yè)機構(gòu)組織的需要。數(shù)據(jù)倉庫的構(gòu)件是直接反映您們單位的主題。這些主題規(guī)定得可滿足企業(yè)的需要而不管運作系統(tǒng)的要求。
數(shù)據(jù)倉庫是整合的。所有業(yè)務(wù)系統(tǒng)的有價值信息都要整合到數(shù)據(jù)倉庫的主題中去。多個業(yè)務(wù)數(shù)據(jù)源數(shù)據(jù)的差別應(yīng)該在裝載到數(shù)據(jù)倉庫之前進行協(xié)調(diào)。
數(shù)據(jù)倉庫提供企業(yè)的歷史回顧。多年的數(shù)據(jù)常以匯總的方式加以存儲。與此對照的,典型的業(yè)務(wù)應(yīng)用只存儲一個較短時段的數(shù)據(jù)。
數(shù)據(jù)倉庫對查詢功能是優(yōu)化的。優(yōu)化通常需要對數(shù)據(jù)預(yù)匯總,預(yù)索引和預(yù)取子集。將數(shù)據(jù)分隔和組合為許多可能的組合(分片和切塊)的能力和有效地反復(fù)查詢大量數(shù)據(jù)的能力是數(shù)據(jù)倉庫的基本要求。
最后,數(shù)據(jù)倉庫必須與分析工具項匹配。裝載和維護數(shù)據(jù)倉庫只是過程的一部分。一個數(shù)據(jù)倉庫只有具備了輔助的決策支持工具時才是完善的,這一決策支持工具應(yīng)反映和利用數(shù)據(jù)倉庫的結(jié)構(gòu)。
5.確認(rèn)業(yè)務(wù)需要和數(shù)據(jù)倉庫的目標(biāo)
????如同已經(jīng)看到的,使用數(shù)據(jù)倉庫技術(shù)有清楚的技術(shù)理由。但是,清晰地設(shè)定數(shù)據(jù)倉庫要實現(xiàn)的業(yè)務(wù)需要和用以評價數(shù)據(jù)倉庫成功的標(biāo)準(zhǔn)這兩者同樣是十分重要的。在大部分情形,數(shù)據(jù)倉庫是為業(yè)務(wù)部門建立的。所以數(shù)據(jù)倉庫的成功依賴于對業(yè)務(wù)部門需求的了解。由于這一點,由業(yè)務(wù)部門確定數(shù)據(jù)倉庫的內(nèi)容是必須的。
????SAS快速建庫方法論也提供問卷和過程,它幫助企業(yè)確定數(shù)據(jù)倉庫內(nèi)容和構(gòu)架。它也幫助企業(yè)確定評價準(zhǔn)則和清楚地界定數(shù)據(jù)倉庫項目。清楚地明白企業(yè)的需要和目標(biāo)也將幫助說明數(shù)據(jù)倉庫項目與企業(yè)的關(guān)系以及數(shù)據(jù)倉庫的作用和企業(yè)成功的關(guān)系。
6.關(guān)鍵成功因素
????除了對企業(yè)的業(yè)務(wù)需求和數(shù)據(jù)倉庫目的有一個清晰的了解外,還需要采取下列步驟確保數(shù)據(jù)倉庫項目滿足這些需要和目標(biāo):
選擇公司可能的最高人員負(fù)責(zé)數(shù)據(jù)倉庫項目。他對項目成功負(fù)有全職。組成包括業(yè)務(wù)決策者和IT專家的跨部門項目組。數(shù)據(jù)倉庫成功的一個關(guān)鍵是業(yè)務(wù)專家和IT專家的密切合作,它將保證數(shù)據(jù)倉庫項目的各個方面都被顧及到。
獲取項目成功所需要的資源投資的承諾。
項目擁有權(quán)的一致意見。
項目評價標(biāo)準(zhǔn)的一致意見。
確保業(yè)務(wù)部門與IT部門一致地為項目成功進行努力。
選擇可以提供數(shù)據(jù)倉庫完整解決方案的可靠和有能力的伙伴。
若實施一個企業(yè)的數(shù)據(jù)倉庫,應(yīng)該在完成第一循環(huán)或項目的模塊后,讓單位的其他成員知道其成功。若這一循環(huán)正確地實現(xiàn)了,其成功應(yīng)該讓有關(guān)的每個人員清楚地看到,因為它是可見的且直接關(guān)系到企業(yè)的目標(biāo)。回到列舉企業(yè)任務(wù)和處理的清單并從新確定其優(yōu)先程度。再選擇擴展數(shù)據(jù)倉庫的下一個項目。
B. SAS快速建立數(shù)據(jù)倉庫方法論的細(xì)節(jié)
????數(shù)據(jù)倉庫建立的過程一直還是比較新的,還缺少實踐經(jīng)驗,并不為IT業(yè)界廣泛了解。此外,數(shù)據(jù)倉庫常是這樣的一個項目,它與單位的許多部門交叉,要求額外的計劃,交流和管理。在這些情況下,最好汲取其它方面的經(jīng)驗并遵循一個合理、經(jīng)驗證的方法論。
????至此,SAS研究所開發(fā)的SAS快速建庫方法論幫助企業(yè)開發(fā)一個高質(zhì)量數(shù)據(jù)倉庫,它可以在預(yù)算的范圍內(nèi)按時地滿足甚至超過用戶的需要和期望。它提供一個檢驗數(shù)據(jù)倉庫開發(fā)和實施是否成功的測試框架。它是基于SAS研究所的咨詢專家、合作伙伴和用戶的最佳實踐和經(jīng)驗教訓(xùn),這些專家成功地實施了數(shù)據(jù)倉庫。這一方法論提供了經(jīng)驗證的建庫框架,包括過程、問卷、工作表單和模板。若企業(yè)自己開發(fā)這些,將是耗時和難于管理的。運用SAS的快速建庫方法論,在實施數(shù)據(jù)倉庫的往復(fù)循環(huán)的各階段會快速地遞交結(jié)果,使得在一個很短的時間段內(nèi)達到一個可量化的結(jié)果。方法輪是運用快速應(yīng)用開發(fā)和SAS系統(tǒng)原型技術(shù)的一個分段式的處理。這是一個整合的,業(yè)務(wù)驅(qū)動的處理:各用戶部門在實施的各階段都有重要的輸入,為報告和分析目的而逐步但快速增長地使用數(shù)據(jù)倉庫,對此IT部門應(yīng)當(dāng)有準(zhǔn)備。
????SAS系統(tǒng)提供的工具(例智能化的客戶機/服務(wù)器,多廠商構(gòu)架等)可以幫助企業(yè)實現(xiàn)一個靈活和低風(fēng)險的處理。相對于數(shù)據(jù)倉庫對企業(yè)的潛在回報,過程的每一步的投入(過程資源、開發(fā)人員和工作人員等)是非常低的。
????使得SAS快速建庫方法論成功的三個主要因素是:
業(yè)務(wù)或用戶的關(guān)注;
細(xì)致的收集用戶需求和項目界定的研討會;
使用快速應(yīng)用開發(fā)(RAD)處理。
????這些特點在下一節(jié)討論。
1.業(yè)務(wù)驅(qū)動
????SAS 快速建庫的方法論是一個高度地以業(yè)務(wù)為驅(qū)動的過程:
了解數(shù)據(jù)倉庫的需要和將從數(shù)據(jù)倉庫中獲益的業(yè)務(wù)管理者必須參加。
業(yè)務(wù)用戶都是項目組的成員。使用有用的技術(shù)收集、建立文檔和改善關(guān)于項目參加者需求的信息。
度量項目業(yè)務(wù)得益的信息應(yīng)在項目的早期階段就加以收集。
重點是放在評估由數(shù)據(jù)倉庫得到的業(yè)務(wù)效益和投資回報。
2.收集需求的研討會
????研討會確立象目標(biāo)、范圍和優(yōu)先這樣一些項目的高水平要素。這些是重要的,因為數(shù)據(jù)倉庫項目要影響許多不同的業(yè)務(wù)領(lǐng)域,這些領(lǐng)域會有不同的優(yōu)先程度。研討會也可以縮短完成項目所需要的時間,因為它使人們聚集在一起,可減少個別交談收集信息的反復(fù)次數(shù)。
3.快速應(yīng)用開發(fā) (RAD)
????一個 RAD循環(huán)是對SAS 快速建庫方法論本質(zhì)的一個寫照,因為需要盡快第看到他們努力的結(jié)果。快速應(yīng)用開發(fā)基于反復(fù)發(fā)展的循環(huán)。即將一個大項目分為小項目,或"構(gòu)件",在此每個構(gòu)件服務(wù)于單個操作單元或功能區(qū)域的信息需要。每個構(gòu)件是一個功能的可管理的單元,是易于理解和可以快速向企業(yè)顯示價值的。
????運用 RAD 可以使項目開發(fā)組為企業(yè)用戶設(shè)定項目的優(yōu)先,為每個構(gòu)件設(shè)定主題以及為每個子項目清楚地劃定范圍。當(dāng)每個局部任務(wù)完成后,會提出和明確進一步的需求。
????循環(huán)式的處理有如下的好處:
有利于應(yīng)用維護。
改進適應(yīng)需求改變的能力。
減小無法管理項目的風(fēng)險。
及早提供用戶的反饋。
及早提交用戶的可度量的好處。
提交高質(zhì)量的解決方案。
及早提供結(jié)果。
C.方法論的框架
????SAS快速建庫的方法論典型地分為概括如下的6步。這些步驟提供工作的邏輯分段和檢驗項目是否建立在一個堅實的基礎(chǔ)上。評估、需求調(diào)查和總結(jié)階段著眼于確認(rèn)、理解和回顧項目目標(biāo)和單位的目標(biāo)。設(shè)計、構(gòu)建和部署階段基于使用RAD 手段設(shè)計、開發(fā)和配置數(shù)據(jù)倉庫環(huán)境。以下的流程圖提供了方法論各個階段的一個總貌和流程。
SAS 快速建庫方法論的各個階段在以下各節(jié)描述。
1.評估階段
????在評估階段,對影響要求解決方案的用戶的現(xiàn)有情況和條件進行了解。了解的目的是分析用戶的問題和解決它的辦法。最初的評估要確認(rèn)和澄清目標(biāo),確認(rèn)為澄清目標(biāo)所做的研究的任何需要,這一評估將導(dǎo)致建議開始、延遲或取消這個項目。確定初始階段項目組的成員和項目范圍、作用和主要的提交結(jié)果。
2.需求調(diào)查階段
????在需求調(diào)查階段,項目組收集業(yè)務(wù)和IT方面的高水平要求。對部門目標(biāo)和信息需求的信息進行收集。本階段的結(jié)果為提交一個報告,這個報告識別業(yè)務(wù)的目的、意義、信息要求和用戶界面。這些需求也將用于數(shù)據(jù)倉庫設(shè)計和項目的其它階段。而且,這個階段完成企業(yè)級的主題數(shù)據(jù)模型和數(shù)據(jù)倉庫主題的選取。與收集業(yè)務(wù)需求的同時,IT需求的調(diào)研也同步地進行。并對主題驅(qū)動數(shù)據(jù)倉庫的IT要求進行分析。
3.設(shè)計階段
????在選取主題方面,項目組集中于收集詳細(xì)的信息要求和設(shè)計數(shù)據(jù)倉庫構(gòu)架,包括數(shù)據(jù),過程和應(yīng)用模型。在這一階段,使用各種信息收集和驗證的手段,包括數(shù)據(jù)建模、過程建模、座談和原型展示。項目組評價技術(shù)構(gòu)架,業(yè)務(wù)需求和信息需求。現(xiàn)有IT構(gòu)架和要求的IT構(gòu)架之間的差別是突出的,建議采用合適的數(shù)據(jù)倉庫設(shè)計和構(gòu)架。
4.構(gòu)建階段
????在構(gòu)建階段,包括構(gòu)建物理的數(shù)據(jù)倉庫并組裝,應(yīng)用和處理的編碼以及驗收測試。在這一階段數(shù)據(jù)倉庫的管理者和終端用戶的指導(dǎo)者應(yīng)熟悉應(yīng)用。當(dāng)測試成功完成后,數(shù)據(jù)倉庫就交付用戶使用和維護。
5.部署階段
????在部署階段,數(shù)據(jù)倉庫展示給其他業(yè)務(wù)用戶并開始進行使用應(yīng)用的訓(xùn)練。在部署后,數(shù)據(jù)倉庫管理者維護數(shù)據(jù)倉庫。對提出的意見進行必要的修改。
6.總結(jié)階段
????在總結(jié)階段,對項目的成功及其對企業(yè)的作用進行評價。總結(jié)分三步進行。第一步總結(jié)早期項目實施成功和失敗的經(jīng)驗和公布以后努力的結(jié)果。第二步是應(yīng)用配置是否如期望的實現(xiàn)了,如有必要須調(diào)整計劃。第三步評估項目對單位的影響和得益。
凡是有該標(biāo)志的文章,都是該blog博主Caoer(草兒)原創(chuàng),凡是索引、收藏
、轉(zhuǎn)載請注明來處和原文作者。非常感謝。