聶永的博客

          記錄工作/學習的點點滴滴。

          Hadoop學習筆記之偽分布式、單節(jié)點環(huán)境搭建

          有關Hadoop在Linux下面部署的文章,很多,一搜一大把,這里簡單略過,把注意事項以及實際中所遇到問題,簡單提一下。hadoop 為1.0.2,Centos為6.2,虛擬機為Oracle VM VirtualBox 4.1.12。

          前置條件

          1. 本機名稱為  namenode
          2. 在 /etc/hosts 增加 namenode/datanode的映射
            eg:
            192.168.2.31 namenode
            192.168.2.31 datanode
          3. ssh namenode
            ssh datanode
            可以無密碼登陸,登陸成功后,退出即可。
          4. 切換到hadoop目錄下
            #cd /usr/java/hadoop
            下面的一切操作都是以此為基礎

          部署步驟

          1. 下載 hadoop 1.0.2解壓到 /usr/java/ 目錄下,解壓目錄為hadoop 1.0.2,重命名為hadoop
                #tar xvf hadoop*.tra.gz;mv hadoop* hadoop
          2. 設置conf/hadoop-env.sh
            export JAVA_HOME=/usr/java/jdk1.6.0_31
          3. #cp -rf src/core/core-default.xml conf/core-site.xml;vi conf/core-site.xml
            修改fs.default.name為hdfs://namenode:9000/
          4. #cp -rf src/hdfs/hdfs-default.xml conf/hdfs-site.xml;vi conf/hdfs-site.xml
            修改dfs.replication設置其數值為1
          5. #cp -rf src/mapred/mapred-default.xml conf/mapred-site.xml;vi conf/mapred-site.xml
            設置mapred.job.tracker為 namenode:9001
          6. 編輯主節(jié)點
            #vi conf/masters
            填寫其值為 namenode 即可
          7. 編輯從節(jié)點
            #vi conf/slaves
            192.168.2.31 datanode
            192.168.2.31 namenode

            上面IP為CentOS中自動獲取的IP,namenode 和 datanode ,雖對應IP一致,特意區(qū)別之。
          8. 格式化文件系統
            #bin/hadoop namenode –format
          9. 啟動Hadoop
            #bin/start-all.sh
          10. #jps
            輸入java版本的PS命令jps,查看hadoop啟動的JVM進程,回車后,會看到類似于:
            [root@namenode ~]# jps
            2764 DataNode
            2866 SecondaryNameNode
            2952 JobTracker
            2666 NameNode
            3061 TaskTracker
            3790 Jps
            只要5個JVM進程(Namenode,Datanode,Jobtracker,TaskTracker,SecondaryNameNode)都啟動,說明hadoop正常啟動了。
          11. Datanode無法啟動一個錯誤
            hadoop/logs目錄下存放相關日志輸出
            #cat hadoop-root-datanode-namenode.log
            大致可以看到
            ERROR org.apache.hadoop.dfs.DataNode: java.io.IOException: Incompatible namespaceIDs in /home/test/dfs/data: namenode namespaceID = 343825810; datanode namespaceID = 233853810
            修改:
            #vi /home/test/dfs/name/current/VERSION
            namespaceID=343825810
            保存退出,關閉hadoop,然后重啟
            #bin/stop-all.sh;bin/start-all.sh
          12. 在Windows的 c:\WINDOWS\system32\drivers\etc\hosts 文件中,添加映射192.168.2.31 datanode
            192.168.2.31 namenode
            保存退出即可

          本文單節(jié)點hadoop配置打包地址:下載地址,可以作為參考。

          后面將說一下在Windows Eclipse中遠程調試Hadoop MapReduce任務。

          posted on 2012-04-23 22:18 nieyong 閱讀(1753) 評論(0)  編輯  收藏


          只有注冊用戶登錄后才能發(fā)表評論。


          網站導航:
           

          公告

          所有文章皆為原創(chuàng),若轉載請標明出處,謝謝~

          新浪微博,歡迎關注:

          導航

          <2012年4月>
          25262728293031
          1234567
          891011121314
          15161718192021
          22232425262728
          293012345

          統計

          常用鏈接

          留言簿(58)

          隨筆分類(130)

          隨筆檔案(151)

          個人收藏

          最新隨筆

          搜索

          最新評論

          閱讀排行榜

          評論排行榜

          主站蜘蛛池模板: 贵溪市| 弥勒县| 四平市| 泽州县| 南安市| 巴林右旗| 山西省| 新宁县| 文安县| 法库县| 济源市| 永丰县| 安阳市| 保靖县| 蒙自县| 兴安盟| 石景山区| 晋中市| 灵台县| 万山特区| 六盘水市| 永城市| 漳浦县| 图木舒克市| 和平县| 靖宇县| 加查县| 沅江市| 青铜峡市| 慈利县| 乌兰察布市| 城固县| 宿松县| 陆川县| 宣城市| 临武县| 西林县| 贵德县| 张家川| 方山县| 武安市|