paulwong

          Kettle - HADOOP數(shù)據(jù)轉(zhuǎn)換工具

          ETL(Extract-Transform-Load的縮寫,即數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的過程),對于企業(yè)或行業(yè)應(yīng)用來說,我們經(jīng)常會遇到各種數(shù)據(jù)的處理,轉(zhuǎn)換,遷移,所以了解并掌握一種etl工具的使用,必不可少,這里我介紹一個我在工作中使用了3年左右的ETL工具Kettle,本著好東西不獨享的想法,跟大家分享碰撞交流一下!在使用中我感覺這個工具真的很強大,支持圖形化的GUI設(shè)計界面,然后可以以工作流的形式流轉(zhuǎn),在做一些簡單或復(fù)雜的數(shù)據(jù)抽取、質(zhì)量檢測、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)過濾等方面有著比較穩(wěn)定的表現(xiàn),其中最主要的我們通過熟練的應(yīng)用它,減少了非常多的研發(fā)工作量,提高了我們的工作效率,不過對于我這個.net研發(fā)者來說唯一的遺憾就是這個工具是Java編寫的。

          http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html

          posted on 2013-08-01 17:21 paulwong 閱讀(803) 評論(0)  編輯  收藏 所屬分類: HADOOP云計算HBASE

          主站蜘蛛池模板: 离岛区| 枝江市| 香格里拉县| 尉犁县| 津市市| 天等县| 房产| 鲁甸县| 黎城县| 琼海市| 连云港市| 江油市| 同心县| 固安县| 饶河县| 临颍县| 兰考县| 东阳市| 阳朔县| 淮北市| 岳西县| 临猗县| 灵丘县| 喀喇| 榆林市| 修文县| 凤台县| 怀安县| 府谷县| 南康市| 布尔津县| 平南县| 绥芬河市| 高雄市| 鹤山市| 宜兰县| 北辰区| 西丰县| 仁寿县| 榆中县| 肃南|