隨筆-314  評論-209  文章-0  trackbacks-0

          Cloudera Manager分析

          目錄

          1. 相關目錄

          2. 配置

          3. 數據庫

          4. CM結構

          5. 升級

          6. 卸載

          7. 開啟postgresql遠程訪問

          1. 相關目錄

          • /var/log/cloudera-scm-installer : 安裝日志目錄。
          • /var/log/* : 相關日志文件(相關服務的及CM的)。
          • /usr/share/cmf/ : 程序安裝目錄。
          • /usr/lib64/cmf/ : Agent程序代碼。
          • /var/lib/cloudera-scm-server-db/data : 內嵌數據庫目錄。
          • /usr/bin/postgres : 內嵌數據庫程序。
          • /etc/cloudera-scm-agent/ : agent的配置目錄。
          • /etc/cloudera-scm-server/ : server的配置目錄。
          • /opt/cloudera/parcels/ : Hadoop相關服務安裝目錄。
          • /opt/cloudera/parcel-repo/ : 下載的服務軟件包數據,數據格式為parcels。
          • /opt/cloudera/parcel-cache/ : 下載的服務軟件包緩存數據。
          • /etc/hadoop/* : 客戶端配置文件目錄。

          2. 配置

          • Hadoop配置文件

            配置文件放置于/var/run/cloudera-scm-agent/process/目錄下。如:/var/run/cloudera-scm-agent/process/193-hdfs-NAMENODE/core-site.xml。這些配置文件是通過Cloudera Manager啟動相應服務(如HDFS)時生成的,內容從數據庫中獲得(即通過界面配置的參數)。

            在CM界面上更改配置是不會立即反映到配置文件中,這些信息會存儲于數據庫中,等下次重啟服務時才會生成配置文件。且每次啟動時都會產生新的配置文件。

            CM Server主要數據庫為scm基中放置配置的數據表為configs。里面包含了服務的配置信息,每一次配置的更改會把當前頁面的所有配置內容添加到數據庫中,以此保存配置修改歷史。

            scm數據庫被配置成只能從localhost訪問,如果需要從外部連接此數據庫,修改vim /var/lib/cloudera-scm-server-db/data/pg_hba.conf文件,之后重啟數據庫。運行數據庫的用戶為cloudera-scm。

          • 查看配置內容

            1. 直接查詢scm數據庫的configs數據表的內容。
            2. 訪問REST API: http://hostname:7180/api/v4/cm/deployment,返回JSON格式部署配置信息。
          • 配置生成方式

            CM為每個服務進程生成獨立的配置目錄(文件)。所有配置統一在服務端查詢數據庫生成(因為scm數據庫只能在localhost下訪問)生成配置文件,再由agent通過網絡下載包含配置文件的zip包到本地解壓到指定的目錄。

          • 配置修改

            CM對于需要修改的配置預先定義,對于沒有預先定義的配置,則通過在高級配置項中使用xml配置片段的方式進行配置。而對于/etc/hadoop/下的配置文件是客戶端的配置,可以在CM通過部署客戶端生成客戶端配置。

          3. 數據庫

          Cloudera manager主要的數據庫為scm,存儲Cloudera manager運行所需要的信息:配置,主機,用戶等。

          4. CM結構

          CM分為Server與Agent兩部分及數據庫(自帶更改過的嵌入Postgresql)。它主要做三件事件:

          1. 管理監控集群主機。
          2. 統一管理配置。
          3. 管理維護Hadoop平臺系統。

          實現采用C/S結構,Agent為客戶端負責執行服務端發來的命令,執行方式一般為使用python調用相應的服務shell腳本。Server端為Java REST服務,提供REST API,Web管理端通過REST API調用Server端功能,Web界面使用富客戶端技術(Knockout)。

          1. Server端主體使用Java實現。
          2. Agent端主體使用Python, 服務的啟動通過調用相應的shell腳本進行啟動,如果啟動失敗會重復4次調用啟動腳本。
          3. Agent與Server保持心跳,使用Thrift RPC框架。

          5. 升級

          在CM中可以通過界面向導升級相關服務。升級過程為三步:

          1. 下載服務軟件包。
          2. 把所下載的服務軟件包分發到集群中受管的機器上。
          3. 安裝服務軟件包,使用軟鏈接的方式把服務程序目錄鏈接到新安裝的軟件包目錄上。

          6. 卸載

          sudo /usr/share/cmf/uninstall-scm-express.sh, 然后刪除/var/lib/cloudera-scm-server-db/目錄,不然下次安裝可能不成功。

          7. 開啟postgresql遠程訪問

          CM內嵌數據庫被配置成只能從localhost訪問,如果需要從外部查看數據,數據修改vim /var/lib/cloudera-scm-server-db/data/pg_hba.conf文件,之后重啟數據庫。運行數據庫的用戶為cloudera-scm。

          posted on 2015-12-25 17:28 xzc 閱讀(439) 評論(0)  編輯  收藏 所屬分類: hadoop
          主站蜘蛛池模板: 阿鲁科尔沁旗| 千阳县| 常德市| 芜湖县| 富阳市| 原平市| 永德县| 黑龙江省| 邛崃市| 溧水县| 长寿区| 阿瓦提县| 绥中县| 平度市| 惠州市| 新民市| 广平县| 敦化市| 太湖县| 肇源县| 新巴尔虎右旗| 射洪县| 富阳市| 汤原县| 海伦市| 盐津县| 稷山县| 纳雍县| 台南县| 大方县| 巢湖市| 安西县| 武胜县| 车致| 吉木乃县| 三明市| 昆明市| 容城县| 东海县| 桂阳县| 长顺县|