paulwong

My Links

Blog Stats

Posts - 1198
Stories - 10
Comments - 108
Trackbacks - 0

常用鏈接

留言簿(67)

隨筆分類(1393)

隨筆檔案(1151)

文章分類(7)

文章檔案(10)

相冊

Test

收藏夾(2)

AI

AI智能PDF問答工具
CSV數據分析智能工具
docker image
ZLibrary
克隆ChatGPT
爆款小紅書AI寫作助手
視頻腳本生成器

Develop

!!!Event Sourcing
!!!Microservice Patterns
!!!NIO清晰解釋
!!PDF SEARCH
4+1 Architectural View Model
Apache安裝及jboss部署說明文檔
APK自動化測試網站
Command-Query Responsibility Segregation
data source
ELK日志分析平臺搭建全過程
Enterprise Architect中文網
EXT 中文站 ver2.0 since 2006-11-20
GOOGLE
GOOGLE
GOOGLE
Google代理
GOREAD RSS閱讀器
INOREADER RSS閱讀器
JavaScript 全棧工程師培訓教程
JBoss3.0 下配置和部署EJB簡介
Jquery Option Plug-in
LCA
MAVEN最佳實踐-版本管理
microservice-security
Mulity Tenant
MYSQL MHA
OAUTH2.0
RARBG TORRENT
Robin's Java World
Spring Boot Admin的使用
spring cloud
SPRING CLOUD教程
Spring 平臺整合 Activiti 工作流引擎實例
SPRING-BEAN自動組裝解釋
Spring-cloud-OAuth2-0配置
SQL2005客戶端下載
SRPING BOOT教程
TCC
TCC
TCC
一個extjs的好網站
一個優秀的CQRS框架Reveno
一個非常不錯的J2EE框架。
一個非常不錯的J2EE框架，從前端的JSP，到菜單，用戶和權限，都有了，還集成了STRUTS。
東莞源豐印刷
本人設計
中國象棋
中國軟件架構師網
不錯的培訓網，有相關文檔下載。
五行湯好轉反應
五行湯好轉反應
人體自愈的秘密
分布式事務1
分布式架構教學
各種大數據
在SPRING CLOUD中使用JAX-RS發布REST服務
在線思維導圖工具
大數據相關應用
學習課程
學習課程
安徽未名細胞治療有限公司
建模工具EA的使用
開源會議系統
指定MAVEN中的JDK版本
數據層的多租戶淺談
無法連接ITUNES STORE的原因
深圳房網
深圳通余額查詢
甘油三脂高應該用什么樣的食療方法
神級翻譯
簡歷模版
管理學
自動組裝SPRING-BEAN例子
通俗易懂的文章收藏
開放式課程
駕車學習
駕駛教學

E-BOOK

Ebook
ex libgen.io, libgen.org, alternative domains: *.li, *.gs, *.lc
EPDF
http://www.allitebooks.org

搜索

閱讀排行榜

評論排行榜

60天內閱讀排行

STORM與HADOOP的比較

對于一堆時刻在增長的數據，如果要統計，可以采取什么方法呢？

等數據增長到一定程度的時候，跑一個統計程序進行統計。適用于實時性要求不高的場景。
如將數據導到HDFS，再運行一個MAP REDUCE JOB。
如果實時性要求高的，上面的方法就不行了。因此就帶來第二種方法。
在數據每次增長一筆的時候，就進行統計JOB，結果放到DB或搜索引擎的INDEX中。
STORM就是完成這種工作的。

HADOOP與STORM比較

數據來源：HADOOP是HDFS上某個文件夾下的可能是成TB的數據，STORM是實時新增的某一筆數據
處理過程：HADOOP是分MAP階段到REDUCE階段，STORM是由用戶定義處理流程，
流程中可以包含多個步驟，每個步驟可以是數據源(SPOUT)或處理邏輯(BOLT)
是否結束：HADOOP最后是要結束的，STORM是沒有結束狀態，到最后一步時，就停在那，直到有新
數據進入時再從頭開始
處理速度：HADOOP是以處理HDFS上大量數據為目的，速度慢，STORM是只要處理新增的某一筆數據即可
可以做到很快。
適用場景：HADOOP是在要處理一批數據時用的，不講究時效性，要處理就提交一個JOB，STORM是要處理
某一新增數據時用的，要講時效性
與MQ對比：HADOOP沒有對比性，STORM可以看作是有N個步驟，每個步驟處理完就向下一個MQ發送消息，
監聽這個MQ的消費者繼續處理

posted on 2013-09-08 19:49 paulwong 閱讀(4582) 評論(0) 編輯收藏所屬分類: LOG ANALYST BIG DATA SYSTEM 、STORM

新用戶注冊刷新評論列表


只有注冊用戶登錄后才能發表評論。




網站導航: 博客園 IT新聞 Chat2DB C++博客博問管理
相關文章: 開源分布式搜索平臺ELK+Redis+Syslog-ng實現日志實時搜索用Kibana和logstash快速搭建實時日志查詢、收集與分析系統 logstash最佳實踐 Logstash logo開源日志管理 Logstash NoSql存儲日志數據之Spring+Logback+Hbase深度集成 Will be reviewing a new Apache Nutch book by Packt ELASTICSEARCH資源 KAFKA資源 STORM啟動與部署TOPOLOGY STORM資源

paulwong

My Links

Blog Stats

常用鏈接

留言簿(67)

隨筆分類(1393)

隨筆檔案(1151)

文章分類(7)

文章檔案(10)

相冊

收藏夾(2)

AI

Develop

E-BOOK

Other

養生

微服務

搜索

最新評論

閱讀排行榜

評論排行榜

60天內閱讀排行

STORM與HADOOP的比較