tangtb

Hadoop,SpringMVC,ExtJs,Struts2,Spring,SpringSecurity,Hibernate,Struts

posts - 25, comments - 88, trackbacks - 0, articles - 0

Hadoop

Hadoop、Hbase、Pig、Sqoop等

Ganglia整合Nagios監控Hadoop集群

摘要: Ganglia是UC Berkeley發起的一個開源集群監視項目，設計用于測量數以千計的節點。Ganglia的核心包含gmond、gmetad以及一個Web前端。主要是用來監控系統性能，如：cpu 、mem、硬盤利用率， I/O負載、網絡流量情況等，通過曲線很容易見到每個節點的工作狀態，對合理調整、分配系統資源，提高系統整體性能起到重要作用閱讀全文

posted @ 2015-02-25 14:48 tangtb 閱讀(6829) | 評論 (0) 編輯 |

Pig安裝配置及基本使用

摘要: Pig是一個基于Hadoop的大規模數據分析平臺對高級過程語言，適合于使用 Hadoop 和 MapReduce 平臺來查詢大型半結構化數據集。通過允許對分布式數據集進行類似 SQL 的查詢，該語言的編譯器會把類SQL的數據分析請求轉換為一系列經過優化處理的MapReduce運算，Pig 可以簡化 Hadoop 的使用。閱讀全文

posted @ 2014-06-04 22:14 tangtb 閱讀(5918) | 評論 (0) 編輯 |

摘要: HBase是一個分布式的、面向列的開源數據庫，該技術來源于 Fay Chang 所撰寫的Google論文“Bigtable：一個結構化數據的分布式存儲系統”。就像Bigtable利用了Google文件系統（File System）所提供的分布式數據存儲一樣，HBase在Hadoop之上提供了類似于Bigtable的能力。HBase是Apache的Hadoop項目的子項目。HBase不同于一般的關系數據庫，它是一個適合于非結構化數據存儲的數據庫。另一個不同的是HBase基于列的而不是基于行的模式。閱讀全文

posted @ 2014-06-04 22:00 tangtb 閱讀(12297) | 評論 (0) 編輯 |

Windows遠程調試Hadoop

摘要: 前置條件
成功安裝配置Hadoop集群
成功編譯安裝Hadoop Eclipse插件
本地有和服務器相同版本的Hadoop安裝包，并已解壓（本例使用hadoop-1.1.2）
閱讀全文

posted @ 2014-06-03 21:09 tangtb 閱讀(1931) | 評論 (0) 編輯 |

Sqoop安裝配置及數據導入導出

摘要: Sqoop項目開始于2009年，最早是作為Hadoop的一個第三方模塊存在，后來為了讓使用者能夠快速部署，也為了讓開發人員能夠更快速的迭代開發，Sqoop獨立成為一個Apache項目。
Sqoop是一個用來將Hadoop和關系型數據庫中的數據相互轉移的工具，可以將一個關系型數據庫（例如： MySQL ,Oracle ,Postgres等）中的數據導進到Hadoop的HDFS中，也可以將HDFS的數據導進到關系型數據庫中。閱讀全文

posted @ 2014-05-31 14:41 tangtb 閱讀(20314) | 評論 (3) 編輯 |

Hadoop安裝配置(更新)

摘要: Hadoop由 Apache Software Foundation 公司于 2005 年秋天作為Lucene的子項目Nutch的一部分正式引入。它受到最先由 Google Lab 開發的 Map/Reduce 和 Google File System(GFS) 的啟發。
Hadoop是一個能夠對大量數據進行分布式處理的軟件框架。但是 Hadoop 是以一種可靠、高效、可伸縮的方式進行處理的。
Hadoop是一個能夠讓用戶輕松架構和使用的分布式計算平臺。用戶可以輕松地在Hadoop上開發和運行處理海量數據的應用程序,用戶可以在不了解分布式底層細節的情況下，開發分布式程序。充分利用集群的威力高速運算和存儲。閱讀全文

posted @ 2014-05-31 14:30 tangtb 閱讀(2555) | 評論 (0) 編輯 |

Hadoop Eclipse插件編譯

posted @ 2014-05-31 14:14 tangtb 閱讀(1603) | 評論 (0) 編輯 |

tangtb

Hadoop

Ganglia整合Nagios監控Hadoop集群

Pig安裝配置及基本使用

HBase完全分布式安裝配置

Windows遠程調試Hadoop

Sqoop安裝配置及數據導入導出

Hadoop安裝配置(更新)

Hadoop Eclipse插件編譯

日歷

公告

常用鏈接

留言簿(9)

隨筆分類(33)

隨筆檔案(25)

收藏夾(2)

ExtJs

搜索

積分與排名

最新評論

閱讀排行榜

評論排行榜