過失
1
:如果您創建了數據倉庫,它們的用途自然顯現出來了
在構造數據倉庫之前,一定不能盲目自信。成功的 DW 規劃必須考慮整個企業的需要并開發出一系列文檔說明的需求以引導工程的設計、構造和展示。
?
過失
2
:遺漏了體系結構框架
全面的體系結構框架的開發和維護是成功地構建 DW 的最重要因素之一,框架必須給出構造的藍圖以及不同 DW 組件的用途。體系結構中必須考慮期望的終端用戶數量、數據容量及多樣性,數據的更新周期等問題。
?
過失
3
:理解用文檔對假設進行說明的重要性
DW 相關假設和潛在數據沖突必須包含在項目體系結構的框架中,需要盡早地在項目文檔中被確定和系統化,以確保在最終產品中反映出來。比如可以加載多少數據,期望數據粒度,多長時間需要對數據進行更新,在那些平臺上開發和實現 DW 等問題。
?
過失
4
:沒有使用正確的工具
DW 設計和構造在很多方面都不同于 OLTP 應用系統的構造, DW 工程需要完全不同的工具:
( 1 )分析工具:標識數據需求, DW 主要數據源以及數據模型的構造,比如 CASE 工具
( 2 )開發工具:負責 ETL 過程,代碼生成,集成等
( 3 )實現工具:收集、處理、清洗、復制和合并倉庫中所包含的數據的數據獲取工具
( 4 )交付工具:進行數據轉化,數據推導以及向最終的交付平臺輸出報表,比如查詢和報表用的數據詞匯表的產生和訪問之用的特殊工具。
?
過失
5
:濫用生命周期
數據倉庫生命周期( DWLC )和傳統系統開發生命周期的最大區別在于 DWLC 永不結束,它是一個持續行為的集合,從對 DW 需求的最初研究經過數據管理再返回。一般來講, DW 每個階段完成后,都會根據新的數據需求、增加的客戶群和新的數據源開始一個新的階段。
?
過失
6
:忽略了數據沖突問題
要設計出好的 DW ,不得不進行大量的、非常冗長的分析以及確定企業內可用的最佳數據源。標識數據源系統后,需要解決不同命名習慣,文件格式大小,值范圍相關沖突等等,這個解決過程需要與數據所有人協作以對未來可能對源數據進行的計劃修改或未計劃的修改達成共識。如果沒有用充分的時間和資源來解決數據沖突問題,將會延遲構建倉庫的開始時間并可能導致危害項目成功的僵局。
?
過失
7
:沒有從失敗中吸取經驗教訓
???? 最好對以往項目過程的過失和錯誤做下詳細記錄
凡是有該標志的文章,都是該blog博主Caoer(草兒)原創,凡是索引、收藏
、轉載請注明來處和原文作者。非常感謝。