paulwong

          Kettle - HADOOP數(shù)據(jù)轉(zhuǎn)換工具

          ETL(Extract-Transform-Load的縮寫,即數(shù)據(jù)抽取、轉(zhuǎn)換、裝載的過程),對于企業(yè)或行業(yè)應(yīng)用來說,我們經(jīng)常會遇到各種數(shù)據(jù)的處理,轉(zhuǎn)換,遷移,所以了解并掌握一種etl工具的使用,必不可少,這里我介紹一個我在工作中使用了3年左右的ETL工具Kettle,本著好東西不獨(dú)享的想法,跟大家分享碰撞交流一下!在使用中我感覺這個工具真的很強(qiáng)大,支持圖形化的GUI設(shè)計(jì)界面,然后可以以工作流的形式流轉(zhuǎn),在做一些簡單或復(fù)雜的數(shù)據(jù)抽取、質(zhì)量檢測、數(shù)據(jù)清洗、數(shù)據(jù)轉(zhuǎn)換、數(shù)據(jù)過濾等方面有著比較穩(wěn)定的表現(xiàn),其中最主要的我們通過熟練的應(yīng)用它,減少了非常多的研發(fā)工作量,提高了我們的工作效率,不過對于我這個.net研發(fā)者來說唯一的遺憾就是這個工具是Java編寫的。

          http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html

          posted on 2013-08-01 17:21 paulwong 閱讀(807) 評論(0)  編輯  收藏 所屬分類: HADOOP云計(jì)算HBASE

          主站蜘蛛池模板: 新河县| 长寿区| 施甸县| 江津市| 仁怀市| 台北县| 永安市| 宁德市| 保山市| 徐州市| 新蔡县| 曲阜市| 昭苏县| 安阳县| 称多县| 澳门| 洛隆县| 芦溪县| 衡阳县| 万盛区| 齐河县| 漳浦县| 瑞安市| 廊坊市| 福贡县| 崇州市| 汪清县| 北川| 柳江县| 平湖市| 天柱县| 绥滨县| 丘北县| 抚宁县| 赤壁市| 兰西县| 邳州市| 明光市| 台州市| 武穴市| 西峡县|