tangtb

          Hadoop,SpringMVC,ExtJs,Struts2,Spring,SpringSecurity,Hibernate,Struts
          posts - 25, comments - 88, trackbacks - 0, articles - 0
            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出

          Posted on 2014-05-31 14:41 tangtb 閱讀(20314) 評論(3)  編輯  收藏 所屬分類: Hadoop

          前置條件

          已經(jīng)成功安裝配置HadoopMysql數(shù)據(jù)庫服務(wù)器,如果將數(shù)據(jù)導(dǎo)入或從Hbase導(dǎo)出,還應(yīng)該已經(jīng)成功安裝配置Hbase。

          下載sqoopMysqlJDBC驅(qū)動

          sqoop-1.2.0-CDH3B4.tar.gz http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz

          mysql-connector-java-5.1.28

          安裝sqoop

          [hadoop@appserver ~]$ tar -zxvf sqoop-1.2.0-CDH3B4.tar.gz

          配置環(huán)境變量

          拷貝Hadoop核心包和MYSQL驅(qū)動包到sqooplib目錄

          [hadoop@appserver ~]$ cp hadoop-1.1.2/hadoop-core-1.1.2.jar sqoop-1.2.0-CDH3B4/lib/

          [hadoop@appserver ~]$ cp  mysql-connector-java-5.1.28-bin.jar sqoop-1.2.0-CDH3B4/lib/

           

          配置sqoop-1.2.0-CDH3B4/bin/configure-sqoop文件

          注釋掉hbase和zookeeper檢查(除非準(zhǔn)備使用HABASE等HADOOP組件)

          啟動hadoop集群

          啟動mysql

          創(chuàng)建sqoop用戶

           

          建立sqoop庫,test表,并構(gòu)造測試數(shù)據(jù)

          測試sqoop連接

          [hadoop@appserver ~]$ sqoop list-databases --connect jdbc:mysql://10.120.10.11:3306/ --username sqoop --password sqoop

          列出mysql中所有數(shù)據(jù)庫的名稱

          mysql導(dǎo)入到hdfs

          sqoop ##sqoop命令

          import ##表示導(dǎo)入

          --connect jdbc:mysql://ip:3306/sqoop ##告訴jdbc,連接mysql的url

          --username sqoop ##連接mysql的用戶名

          --password sqoop ##連接mysql的密碼

          --table test ##從mysql導(dǎo)出的表名稱

          --fields-terminated-by '\t' ##指定輸出文件中的行的字段分隔符

          -m 1 ##復(fù)制過程使用1個map作業(yè)

           

          [hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --fields-terminated-by ':' -m 1

          Hadoop中查看導(dǎo)入結(jié)果

          hdfs導(dǎo)出到mysql

          sqoop

          export ##表示數(shù)據(jù)從hive復(fù)制到mysql中

          --connect jdbc:mysql://ip:3306/sqoop

          --username sqoop

          --password sqoop

          --table test ##mysql中的表,即將被導(dǎo)入的表名稱

          --export-dir '/user/root/aa/part-m-00000' ##hive中被導(dǎo)出的文件

          --fields-terminated-by '\t' ##hive中被導(dǎo)出的文件字段的分隔符

          [hadoop@appserver ~]$ sqoop export --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --export-dir '/user/hadoop/test/part-m-00000' --fields-terminated-by ':' -m 1

          Mysql中查看導(dǎo)出結(jié)果

          Mysql導(dǎo)入到Hbase

          參數(shù)說明:

          Ø hbase_tablename指定要導(dǎo)成hbase的表名

          Ø key_col_name指定mysql數(shù)據(jù)庫表中哪一列作為hbase新表的rowkey

          Ø col_fam_name是除rowkey之外的所有列的列族名

          [hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --hbase-create-table --hbase-table mysql_sqoop_test --column-family info --hbase-row-key id -m 1

          Hbase中查看結(jié)果


          評論

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出  回復(fù)  更多評論   

          2014-06-04 17:02 by 艾青
          不錯的東東,謝謝樓主分享!

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出[未登錄]  回復(fù)  更多評論   

          2014-07-07 09:50 by 小豪
          記得以前在http://www.lq580.com/有相關(guān)的介紹,不過現(xiàn)在怎么變成了一個叫綠求網(wǎng)的東東呢,不明白?

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出  回復(fù)  更多評論   

          2016-06-22 20:54 by Hadoop
          不錯 就是有點淺
          主站蜘蛛池模板: 扎鲁特旗| 和静县| 海兴县| 青阳县| 侯马市| 墨江| 三都| 勐海县| 彭泽县| 巫山县| 贞丰县| 定襄县| 新乡县| 张家口市| 临漳县| 内黄县| 股票| 中卫市| 锡林郭勒盟| 栾川县| 昭通市| 门头沟区| 含山县| 乌鲁木齐县| 栾城县| 海兴县| 沐川县| 武威市| 安阳市| 子洲县| 阿克| 定西市| 临夏市| 菏泽市| 合肥市| 台东县| 孝感市| 罗山县| 通道| 邵阳市| 花莲市|