過失
1
:如果您創(chuàng)建了數(shù)據(jù)倉庫,它們的用途自然顯現(xiàn)出來了
在構(gòu)造數(shù)據(jù)倉庫之前,一定不能盲目自信。成功的 DW 規(guī)劃必須考慮整個企業(yè)的需要并開發(fā)出一系列文檔說明的需求以引導(dǎo)工程的設(shè)計、構(gòu)造和展示。
?
過失
2
:遺漏了體系結(jié)構(gòu)框架
全面的體系結(jié)構(gòu)框架的開發(fā)和維護是成功地構(gòu)建 DW 的最重要因素之一,框架必須給出構(gòu)造的藍圖以及不同 DW 組件的用途。體系結(jié)構(gòu)中必須考慮期望的終端用戶數(shù)量、數(shù)據(jù)容量及多樣性,數(shù)據(jù)的更新周期等問題。
?
過失
3
:理解用文檔對假設(shè)進行說明的重要性
DW 相關(guān)假設(shè)和潛在數(shù)據(jù)沖突必須包含在項目體系結(jié)構(gòu)的框架中,需要盡早地在項目文檔中被確定和系統(tǒng)化,以確保在最終產(chǎn)品中反映出來。比如可以加載多少數(shù)據(jù),期望數(shù)據(jù)粒度,多長時間需要對數(shù)據(jù)進行更新,在那些平臺上開發(fā)和實現(xiàn) DW 等問題。
?
過失
4
:沒有使用正確的工具
DW 設(shè)計和構(gòu)造在很多方面都不同于 OLTP 應(yīng)用系統(tǒng)的構(gòu)造, DW 工程需要完全不同的工具:
( 1 )分析工具:標(biāo)識數(shù)據(jù)需求, DW 主要數(shù)據(jù)源以及數(shù)據(jù)模型的構(gòu)造,比如 CASE 工具
( 2 )開發(fā)工具:負責(zé) ETL 過程,代碼生成,集成等
( 3 )實現(xiàn)工具:收集、處理、清洗、復(fù)制和合并倉庫中所包含的數(shù)據(jù)的數(shù)據(jù)獲取工具
( 4 )交付工具:進行數(shù)據(jù)轉(zhuǎn)化,數(shù)據(jù)推導(dǎo)以及向最終的交付平臺輸出報表,比如查詢和報表用的數(shù)據(jù)詞匯表的產(chǎn)生和訪問之用的特殊工具。
?
過失
5
:濫用生命周期
數(shù)據(jù)倉庫生命周期( DWLC )和傳統(tǒng)系統(tǒng)開發(fā)生命周期的最大區(qū)別在于 DWLC 永不結(jié)束,它是一個持續(xù)行為的集合,從對 DW 需求的最初研究經(jīng)過數(shù)據(jù)管理再返回。一般來講, DW 每個階段完成后,都會根據(jù)新的數(shù)據(jù)需求、增加的客戶群和新的數(shù)據(jù)源開始一個新的階段。
?
過失
6
:忽略了數(shù)據(jù)沖突問題
要設(shè)計出好的 DW ,不得不進行大量的、非常冗長的分析以及確定企業(yè)內(nèi)可用的最佳數(shù)據(jù)源。標(biāo)識數(shù)據(jù)源系統(tǒng)后,需要解決不同命名習(xí)慣,文件格式大小,值范圍相關(guān)沖突等等,這個解決過程需要與數(shù)據(jù)所有人協(xié)作以對未來可能對源數(shù)據(jù)進行的計劃修改或未計劃的修改達成共識。如果沒有用充分的時間和資源來解決數(shù)據(jù)沖突問題,將會延遲構(gòu)建倉庫的開始時間并可能導(dǎo)致危害項目成功的僵局。
?
過失
7
:沒有從失敗中吸取經(jīng)驗教訓(xùn)
???? 最好對以往項目過程的過失和錯誤做下詳細記錄
凡是有該標(biāo)志的文章,都是該blog博主Caoer(草兒)原創(chuàng),凡是索引、收藏
、轉(zhuǎn)載請注明來處和原文作者。非常感謝。