tangtb

          Hadoop,SpringMVC,ExtJs,Struts2,Spring,SpringSecurity,Hibernate,Struts
          posts - 25, comments - 88, trackbacks - 0, articles - 0
            BlogJava :: 首頁 :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出

          Posted on 2014-05-31 14:41 tangtb 閱讀(20290) 評論(3)  編輯  收藏 所屬分類: Hadoop

          前置條件

          已經(jīng)成功安裝配置HadoopMysql數(shù)據(jù)庫服務(wù)器,如果將數(shù)據(jù)導(dǎo)入或從Hbase導(dǎo)出,還應(yīng)該已經(jīng)成功安裝配置Hbase。

          下載sqoopMysqlJDBC驅(qū)動

          sqoop-1.2.0-CDH3B4.tar.gz http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz

          mysql-connector-java-5.1.28

          安裝sqoop

          [hadoop@appserver ~]$ tar -zxvf sqoop-1.2.0-CDH3B4.tar.gz

          配置環(huán)境變量

          拷貝Hadoop核心包和MYSQL驅(qū)動包到sqooplib目錄

          [hadoop@appserver ~]$ cp hadoop-1.1.2/hadoop-core-1.1.2.jar sqoop-1.2.0-CDH3B4/lib/

          [hadoop@appserver ~]$ cp  mysql-connector-java-5.1.28-bin.jar sqoop-1.2.0-CDH3B4/lib/

           

          配置sqoop-1.2.0-CDH3B4/bin/configure-sqoop文件

          注釋掉hbase和zookeeper檢查(除非準(zhǔn)備使用HABASE等HADOOP組件)

          啟動hadoop集群

          啟動mysql

          創(chuàng)建sqoop用戶

           

          建立sqoop庫,test表,并構(gòu)造測試數(shù)據(jù)

          測試sqoop連接

          [hadoop@appserver ~]$ sqoop list-databases --connect jdbc:mysql://10.120.10.11:3306/ --username sqoop --password sqoop

          列出mysql中所有數(shù)據(jù)庫的名稱

          mysql導(dǎo)入到hdfs

          sqoop ##sqoop命令

          import ##表示導(dǎo)入

          --connect jdbc:mysql://ip:3306/sqoop ##告訴jdbc,連接mysql的url

          --username sqoop ##連接mysql的用戶名

          --password sqoop ##連接mysql的密碼

          --table test ##從mysql導(dǎo)出的表名稱

          --fields-terminated-by '\t' ##指定輸出文件中的行的字段分隔符

          -m 1 ##復(fù)制過程使用1個map作業(yè)

           

          [hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --fields-terminated-by ':' -m 1

          Hadoop中查看導(dǎo)入結(jié)果

          hdfs導(dǎo)出到mysql

          sqoop

          export ##表示數(shù)據(jù)從hive復(fù)制到mysql中

          --connect jdbc:mysql://ip:3306/sqoop

          --username sqoop

          --password sqoop

          --table test ##mysql中的表,即將被導(dǎo)入的表名稱

          --export-dir '/user/root/aa/part-m-00000' ##hive中被導(dǎo)出的文件

          --fields-terminated-by '\t' ##hive中被導(dǎo)出的文件字段的分隔符

          [hadoop@appserver ~]$ sqoop export --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --export-dir '/user/hadoop/test/part-m-00000' --fields-terminated-by ':' -m 1

          Mysql中查看導(dǎo)出結(jié)果

          Mysql導(dǎo)入到Hbase

          參數(shù)說明:

          Ø hbase_tablename指定要導(dǎo)成hbase的表名

          Ø key_col_name指定mysql數(shù)據(jù)庫表中哪一列作為hbase新表的rowkey

          Ø col_fam_name是除rowkey之外的所有列的列族名

          [hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --hbase-create-table --hbase-table mysql_sqoop_test --column-family info --hbase-row-key id -m 1

          Hbase中查看結(jié)果


          評論

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出  回復(fù)  更多評論   

          2014-06-04 17:02 by 艾青
          不錯的東東,謝謝樓主分享!

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出[未登錄]  回復(fù)  更多評論   

          2014-07-07 09:50 by 小豪
          記得以前在http://www.lq580.com/有相關(guān)的介紹,不過現(xiàn)在怎么變成了一個叫綠求網(wǎng)的東東呢,不明白?

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出  回復(fù)  更多評論   

          2016-06-22 20:54 by Hadoop
          不錯 就是有點淺
          主站蜘蛛池模板: 荆门市| 江源县| 应城市| 顺义区| 新泰市| 南木林县| 淮南市| 渝北区| 营山县| 堆龙德庆县| 苗栗市| 澎湖县| 涟源市| 马山县| 张家口市| 盐池县| 栖霞市| 奎屯市| 上虞市| 邵阳县| 林甸县| 丰宁| 锡林浩特市| 岫岩| 阜宁县| 漯河市| 澄江县| 沙雅县| 吴忠市| 镇原县| 沙湾县| 台江县| 丹凤县| 晋宁县| 四川省| 湘潭市| 英山县| 集贤县| 江阴市| 林口县| 同心县|