paulwong

          Kettle - HADOOP數據轉換工具

          ETL(Extract-Transform-Load的縮寫,即數據抽取、轉換、裝載的過程),對于企業或行業應用來說,我們經常會遇到各種數據的處理,轉換,遷移,所以了解并掌握一種etl工具的使用,必不可少,這里我介紹一個我在工作中使用了3年左右的ETL工具Kettle,本著好東西不獨享的想法,跟大家分享碰撞交流一下!在使用中我感覺這個工具真的很強大,支持圖形化的GUI設計界面,然后可以以工作流的形式流轉,在做一些簡單或復雜的數據抽取、質量檢測、數據清洗、數據轉換、數據過濾等方面有著比較穩定的表現,其中最主要的我們通過熟練的應用它,減少了非常多的研發工作量,提高了我們的工作效率,不過對于我這個.net研發者來說唯一的遺憾就是這個工具是Java編寫的。

          http://www.cnblogs.com/limengqiang/archive/2013/01/16/KettleApply1.html

          posted on 2013-08-01 17:21 paulwong 閱讀(804) 評論(0)  編輯  收藏 所屬分類: HADOOP云計算HBASE

          主站蜘蛛池模板: 喀喇沁旗| 屯昌县| 龙泉市| 汉阴县| 科尔| 洛川县| 嵊泗县| 苍梧县| 铜鼓县| 安乡县| 山西省| 兴和县| 青神县| 土默特右旗| 凯里市| 贺兰县| 西贡区| 高阳县| 昌都县| 昌吉市| 工布江达县| 城步| 巴南区| 宝丰县| 安溪县| 天津市| 拉萨市| 三门县| 永登县| 张家港市| 长子县| 许昌县| 米易县| 潜山县| 金川县| 行唐县| 乌拉特中旗| 卫辉市| 大渡口区| 吉木萨尔县| 姜堰市|