tangtb

          Hadoop,SpringMVC,ExtJs,Struts2,Spring,SpringSecurity,Hibernate,Struts
          posts - 25, comments - 88, trackbacks - 0, articles - 0
            BlogJava :: 首頁(yè) :: 新隨筆 :: 聯(lián)系 :: 聚合  :: 管理

          Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出

          Posted on 2014-05-31 14:41 tangtb 閱讀(20308) 評(píng)論(3)  編輯  收藏 所屬分類(lèi): Hadoop

          前置條件

          已經(jīng)成功安裝配置HadoopMysql數(shù)據(jù)庫(kù)服務(wù)器,如果將數(shù)據(jù)導(dǎo)入或從Hbase導(dǎo)出,還應(yīng)該已經(jīng)成功安裝配置Hbase。

          下載sqoopMysqlJDBC驅(qū)動(dòng)

          sqoop-1.2.0-CDH3B4.tar.gz http://archive.cloudera.com/cdh/3/sqoop-1.2.0-CDH3B4.tar.gz

          mysql-connector-java-5.1.28

          安裝sqoop

          [hadoop@appserver ~]$ tar -zxvf sqoop-1.2.0-CDH3B4.tar.gz

          配置環(huán)境變量

          拷貝Hadoop核心包和MYSQL驅(qū)動(dòng)包到sqooplib目錄

          [hadoop@appserver ~]$ cp hadoop-1.1.2/hadoop-core-1.1.2.jar sqoop-1.2.0-CDH3B4/lib/

          [hadoop@appserver ~]$ cp  mysql-connector-java-5.1.28-bin.jar sqoop-1.2.0-CDH3B4/lib/

           

          配置sqoop-1.2.0-CDH3B4/bin/configure-sqoop文件

          注釋掉hbase和zookeeper檢查(除非準(zhǔn)備使用HABASE等HADOOP組件)

          啟動(dòng)hadoop集群

          啟動(dòng)mysql

          創(chuàng)建sqoop用戶(hù)

           

          建立sqoop庫(kù),test表,并構(gòu)造測(cè)試數(shù)據(jù)

          測(cè)試sqoop連接

          [hadoop@appserver ~]$ sqoop list-databases --connect jdbc:mysql://10.120.10.11:3306/ --username sqoop --password sqoop

          列出mysql中所有數(shù)據(jù)庫(kù)的名稱(chēng)

          mysql導(dǎo)入到hdfs

          sqoop ##sqoop命令

          import ##表示導(dǎo)入

          --connect jdbc:mysql://ip:3306/sqoop ##告訴jdbc,連接mysql的url

          --username sqoop ##連接mysql的用戶(hù)名

          --password sqoop ##連接mysql的密碼

          --table test ##從mysql導(dǎo)出的表名稱(chēng)

          --fields-terminated-by '\t' ##指定輸出文件中的行的字段分隔符

          -m 1 ##復(fù)制過(guò)程使用1個(gè)map作業(yè)

           

          [hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --fields-terminated-by ':' -m 1

          Hadoop中查看導(dǎo)入結(jié)果

          hdfs導(dǎo)出到mysql

          sqoop

          export ##表示數(shù)據(jù)從hive復(fù)制到mysql中

          --connect jdbc:mysql://ip:3306/sqoop

          --username sqoop

          --password sqoop

          --table test ##mysql中的表,即將被導(dǎo)入的表名稱(chēng)

          --export-dir '/user/root/aa/part-m-00000' ##hive中被導(dǎo)出的文件

          --fields-terminated-by '\t' ##hive中被導(dǎo)出的文件字段的分隔符

          [hadoop@appserver ~]$ sqoop export --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --export-dir '/user/hadoop/test/part-m-00000' --fields-terminated-by ':' -m 1

          Mysql中查看導(dǎo)出結(jié)果

          Mysql導(dǎo)入到Hbase

          參數(shù)說(shuō)明:

          Ø hbase_tablename指定要導(dǎo)成hbase的表名

          Ø key_col_name指定mysql數(shù)據(jù)庫(kù)表中哪一列作為hbase新表的rowkey

          Ø col_fam_name是除rowkey之外的所有列的列族名

          [hadoop@appserver ~]$ sqoop import --connect jdbc:mysql://10.120.10.11:3306/sqoop --username sqoop --password sqoop --table test --hbase-create-table --hbase-table mysql_sqoop_test --column-family info --hbase-row-key id -m 1

          Hbase中查看結(jié)果


          評(píng)論

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出  回復(fù)  更多評(píng)論   

          2014-06-04 17:02 by 艾青
          不錯(cuò)的東東,謝謝樓主分享!

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出[未登錄](méi)  回復(fù)  更多評(píng)論   

          2014-07-07 09:50 by 小豪
          記得以前在http://www.lq580.com/有相關(guān)的介紹,不過(guò)現(xiàn)在怎么變成了一個(gè)叫綠求網(wǎng)的東東呢,不明白?

          # re: Sqoop安裝配置及數(shù)據(jù)導(dǎo)入導(dǎo)出  回復(fù)  更多評(píng)論   

          2016-06-22 20:54 by Hadoop
          不錯(cuò) 就是有點(diǎn)淺
          主站蜘蛛池模板: 和林格尔县| 阿坝县| 栾川县| 岑溪市| 龙游县| 儋州市| 丹江口市| 塔河县| 开封县| 泾川县| 阜阳市| 高雄市| 泌阳县| 喜德县| 桂阳县| 宜黄县| 安阳县| 东乌珠穆沁旗| 泌阳县| 余姚市| 呼玛县| 木里| 玛沁县| 汝城县| 保定市| 渭南市| 信丰县| 高平市| 桂平市| 定州市| 靖边县| 宝坻区| 尉氏县| 纳雍县| 金昌市| 伊宁县| 象山县| 泌阳县| 建宁县| 武城县| 湘阴县|