MapReduce發力:發布支持Eclipse和Amazon EC2平臺的工具插件[ZZ]
From:Click Here
作者 Scott Delap譯者 Jason Lai? 發布于 2007年3月29日 上午9時28分
IBM Alphaworks網站發布了一個新的Eclipse插件,使用開源Java MapReduce框架Hadoop來簡化應用程序的開發。Hadoop框架的產生最初是為了支持Nutch項目。Hadoop包含了一個分布式文件系統以及MapReduce編程結構的一個實現,該實現被Google廣泛用于進行跨集群海量數據集的并行處理。今年在Hadoop上所做的集成工作使得在Amazon的EC2平臺上運行Hadoop MapReduce應用和使用Amazon的S3平臺進行存儲等更為容易。Amazon Web服務博客表示:“由于EC2實體和存儲于S3上的數據之間的帶寬尚未度量或發布,這是處理大量數據的一種很節約成本的方式”。
IBM MapReduce插件包含以下功能:
- 允許Java?項目以JAR(Java Archive)文件形式打包并部署到(本地和遠程的)Hadoop服務器上
- 提供輔助開發過程的備忘單(Cheat Sheets)
- 增加了一個獨立的Eclipse透視圖(Perspective),以及用于顯示Hadoop服務器、Hadoop分布式文件系統(DFS)和當前任務狀態的視圖
- 提供了一些向導,使基于MapReduce框架的類的開發變得更加容易
此外,它還包括了改進的備忘單,并且完全兼容OS X。插件使用SCP和SSH與Hadoop服務器進行交互,通過HTTP協議獲取工作狀態。
posted on 2007-03-31 10:03 XiaoLi 閱讀(2767) 評論(0) 編輯 收藏 所屬分類: Eclipse 、Others