Kettle - HADOOP數(shù)據(jù)轉(zhuǎn)換工具
ETL(Extract-Transform-Load的縮寫,即數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的過程),對于企業(yè)或行業(yè)應(yīng)用來說,我們經(jīng)常會遇到各種數(shù)據(jù)的處理,轉(zhuǎn)換,遷移,所以了解并掌握一種etl工具的使用,必不可少,這里我介紹一個我在工作中使用了3年左右的ETL工具Kettle,本著好東西不獨享的想法,跟大家分享碰撞交流一下!在使用中我感覺這個工具真的很強大,支持圖形化的GUI設(shè)計界面,然后可以以工作流的形式流轉(zhuǎn),在做一些簡單或復(fù)雜的數(shù)據(jù)抽取、質(zhì)量檢測、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)過濾等方面有著比較穩(wěn)定的表現(xiàn),其中最主要的我們通過熟練的應(yīng)用它,減少了非常多的研發(fā)工作量,提高了我們的工作效率,不過對于我這個.net研發(fā)者來說唯一的遺憾就是這個工具是Java編寫的。http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html
posted on 2013-08-01 17:21 paulwong 閱讀(803) 評論(0) 編輯 收藏 所屬分類: HADOOP 、云計算 、HBASE