本站不再更新,歡迎光臨 java開發技術網
          隨筆-230  評論-230  文章-8  trackbacks-0
          1、ETL主要是做數據整理,實體視圖用于優化不匯總數據。

          根據模型的設計和源數據的情況,有四種數據ETL模式:

             完全刷新:數據倉庫數據表中只包括最新的數據,每次加載均刪除原有數據,然后完全加載最新的源數據。這種模式下,數據抽取程序抽取源數據中的所有記錄,在加載前,將目標數據表清空,然后加載所有記錄。為提高刪除數據的速度,一般是采用Truncate清空數據表。如本系統中的入庫當前信息表采用此種模式。

          鏡像增量:源數據中的記錄定期更新,但記錄中包括記錄時間字段,源數據中保存了數據歷史的記錄,ETL可以通過記錄時間將增量數據從源數據抽取出來以附加的方式加載到數據倉庫中,數據的歷史記錄也會被保留在數據倉庫中。
           
          事件增量:每一個記錄是一個新的事件,相互之間沒有必然的聯系,新記錄不是對原有記錄數值的變更,記錄包括時間字段,可以通過時間字段將新增數據抽取出來加載到數據庫中。

          鏡像比較:數據倉庫數據具有生效日期字段以保存數據的歷史信息,而源數據不保留歷史并且每天都可能被更新。因此,只能將新的鏡像數據與上次加載的數據的鏡像進行比較,找出變更部分,更新歷史數據被更新記錄的生效終止日期,并添加變更后的數據。大多數源數據中需保存歷史信息的維表

          posted on 2008-07-14 12:13 有貓相伴的日子 閱讀(528) 評論(0)  編輯  收藏 所屬分類: BI

          只有注冊用戶登錄后才能發表評論。


          網站導航:
           
          本站不再更新,歡迎光臨 java開發技術網
          主站蜘蛛池模板: 吉林市| 鹤山市| 兖州市| 志丹县| 柳江县| 曲沃县| 沧源| 繁昌县| 稻城县| 广宗县| 湖南省| 沙田区| 砀山县| 葫芦岛市| 霞浦县| 建水县| 改则县| 兰州市| 普宁市| 同江市| 新疆| 安平县| 策勒县| 桐梓县| 奉化市| 陇西县| 邓州市| 阜新| 东乡县| 治多县| 武宣县| 黄大仙区| 溧阳市| 洪雅县| 台南县| 大名县| 西乌珠穆沁旗| 香港 | 出国| 东乌| 中阳县|