paulwong

          配置Hadoop M/R 采用Fair Scheduler算法代替FIFO

          采用Cloudera版本的hadoop/hbase:

          hadoop-0.20.2-cdh3u0

          hbase-0.90.1-cdh3u0

          zookeeper-3.3.3-cdh3u0

          默認已支持FairScheduler調度算法.

          只需改配置使期用FairSchedule而非默認的JobQueueTaskScheduler即可.

          配置fair-scheduler.xml (/$HADOOP_HOME/conf/):

          <?xml version="1.0"?>
          <property>
              <name>mapred.fairscheduler.allocation.file</name>
              <value>[HADOOP_HOME]/conf/fair-scheduler.xml</value>
          </property>
          <allocations>
              <pool name="qiji-task-pool">
                  <minMaps>5</minMaps>
                  <minReduces>5</minReduces>
                  <maxRunningJobs>
                      <maxRunningJobs>5</maxRunningJobs>
                      <minSharePreemptionTimeout>300</minSharePreemptionTimeout>
                      <weight>1.0</weight>
              </pool>
              <user name="ecap">
                  <maxRunningJobs>
                      <maxRunningJobs>6</maxRunningJobs>
              </user>
              <poolMaxJobsDefault>10</poolMaxJobsDefault>
              <userMaxJobsDefault>8</userMaxJobsDefault>
              <defaultMinSharePreemptionTimeout>600
              </defaultMinSharePreemptionTimeout>
              <fairSharePreemptionTimeout>600</fairSharePreemptionTimeout>
          </allocations>



          配置$HADOOP_HOME/conf/mapred-site.xml,最后添加:

          <property>
              <name>mapred.jobtracker.taskScheduler</name>
              <value>org.apache.hadoop.mapred.FairScheduler</value>
          </property>
          <property>
              <name>mapred.fairscheduler.allocation.file</name>
              <value>/opt/hadoop/conf/fair-scheduler.xml</value>
          </property>
          <property>
              <name>mapred.fairscheduler.assignmultiple</name>
              <value>true</value>
          </property>
          <property>
              <name>mapred.fairscheduler.sizebasedweight</name>
              <value>true</value>
          </property>



          然后重新運行集群,這樣有幾個Job(上面配置是5個并行)并行運行時,不會因為一個Job把Map/Reduce占滿而使其它Job處于Pending狀態.

          可從: http://<masterip>:50030/scheduler查看并行運行的狀態.

          posted on 2013-01-31 17:30 paulwong 閱讀(1523) 評論(1)  編輯  收藏 所屬分類: HADOOP云計算

          Feedback

          # re: 配置Hadoop M/R 采用Fair Scheduler算法代替FIFO 2013-05-17 10:07 Christopher

          樓主你好,最近我也在配置hadoop的fair scheduler, 但是遇到了一些問題。
          首先我使用的是cloudera-cdh-demo-vm-4.2.0-kvm。當我配置$HADOOP_HOME/conf/mapred-site.xml時,指定pool的分配文件,
          <property>
          <name>mapred.fairscheduler.allocation.file</name>
          <value>/usr/lib/hadoop-0.20-mapreduce/conf/fair-scheduler.xml</value>
          </property>
          重啟cluster之后,無法登錄http://<masterip>:50030/scheduler查看并行運行的狀態.
          請問樓主可否解答?如果需要更詳細的配置,能否留下郵箱進一步讓我進一步咨詢。
            回復  更多評論   


          主站蜘蛛池模板: 即墨市| 磐石市| 长沙市| 乌兰察布市| 页游| 遵义县| 望城县| 新营市| 屏山县| 鄂托克前旗| 宁远县| 宁蒗| 泗阳县| 来凤县| 南木林县| 东乌珠穆沁旗| 隆昌县| 凤城市| 洪湖市| 南阳市| 平罗县| 文山县| 巧家县| 麻江县| 独山县| 宁津县| 多伦县| 惠来县| 绥中县| 平利县| 信丰县| 阜康市| 丽江市| 依安县| 体育| 富裕县| 永川市| 安泽县| 乌海市| 明水县| 习水县|