storm簡介

Storm:Apache Storm is a free and open source distributed realtime computation (實時計算)system. Storm makes it easy to reliably process unbounded streams of data(海量數(shù)據(jù)流的可靠的處理), doing for realtime processing what Hadoop did for batch processing. Storm is simple, can be used with any programming language, and is a lot of fun to use!

Twitter開發(fā) 類似于Hadoop的實時處理框架

storm的官網(wǎng) storm.apache.org

storm核心代碼是由Clojure語言寫的,Clojure語言既能面向?qū)ο缶幊?,也能面向函?shù)式編程,也是基于JVM。

Storm的應用場景

Storm has many use cases: realtime analytics(實時分析), online machine learning(在線機器學習), continuous computation(持續(xù)的計算), distributed RPC(分布式RPC), ETL(數(shù)據(jù)清洗), and more.

?Storm is fast: a benchmark(標桿) clocked(時控) it at over?a million tuples processed per second per node. It is scalable(可擴展), fault-tolerant(容錯), guarantees your data will be processed, and is easy to set up and operate(保證數(shù)據(jù)被處理,易于被設(shè)置和操作).

1)交通部門,監(jiān)控高速路上超速車輛

2)電商網(wǎng)站,類似于淘寶的大屏(順序累加)

3)京東/一號店的實時推薦(協(xié)同算法,用戶標簽(畫像))

4)告警系統(tǒng)

5)金融:實時去判斷交易不是欺詐行為(涉及機器學習)

6)實時監(jiān)測網(wǎng)站有沒有遭受攻擊

storm實時,吞吐量小

Hadoop離線,吞吐量大

處理過程:Hadoop是Map和reduce階段,Storm分為Spout和bolt兩個階段。

是否結(jié)束:Hadoop最終會結(jié)束,storm沒有結(jié)束狀態(tài)

處理速度:Hadoop處理TB級別數(shù)據(jù),處理速度慢;Storm處理的是某一筆新增的數(shù)據(jù)即可,處理速度快。

使用場景:Hadoop使用的是批處理,主要用于不講究時效性的項目;storm適合講究時效性的項目。


Storm與Mapreduce1對比

MapReduce:主要用來處理高延遲的作業(yè),主節(jié)點叫做JobTracker,從節(jié)點叫做TaskTracker;運行時作業(yè)分兩種類型:Map,Reducer

Storm主要用來處理低延遲的作業(yè),主節(jié)點叫做Nimbus,從節(jié)點叫做SuperVisor。用戶提交作業(yè)給Nimbus,Nimbus把任務分配給SuperVisor,這些提交的任務叫做Topology(拓撲)。運行時作業(yè)分兩種類型:Spout,bolt


Storm運送數(shù)據(jù)依靠stream(水流)

5號線地鐵->stream

車廂->tuple

乘客->數(shù)據(jù)

乘客要上下車->topo任務

起始站->spout

中間站和終點站->bolt

storm處理數(shù)據(jù)過程

第一個案例:需求:求數(shù)字1-9累加和

Spout的任務:生成數(shù)字1-9并發(fā)射(emit)

bolt的任務:根據(jù)fields名稱獲取數(shù)字,進行累加

運行:main方法:new TopologyBulider(),setSpout,setBolt


nohup storm nimbus > ?/dev/null ?2>&1 &:表示將標準輸出和錯誤輸出都輸出到/dev/null目錄中進行回收,1表示標準輸出,2表示錯誤與輸出,默認是1:標準輸出

storm的UI界面地址:host:8080

ps -ef | grep java | awk '{print $1, $2}'

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務。

相關(guān)閱讀更多精彩內(nèi)容

  • Date: Nov 17-24, 2017 1. 目的 積累Storm為主的流式大數(shù)據(jù)處理平臺對實時數(shù)據(jù)處理的相關(guān)...
    一只很努力爬樹的貓閱讀 2,333評論 0 4
  • 原文鏈接Storm Tutorial 本人原創(chuàng)翻譯,轉(zhuǎn)載請注明出處 這個教程內(nèi)容包含如何創(chuàng)建topologies及...
    quiterr閱讀 1,762評論 0 6
  • 作者:王淵(2017年4月2日) 題記____ 人性就像一條小溪,在泛著清澈浪花的同時,也翻著垃圾…… 這幾年...
    仁者無敵簡書閱讀 341評論 0 1
  • 圖上不難發(fā)現(xiàn)一只腳穿了襪子,一只沒有。另外一只下了出租去等候室的路上掉了,因為已經(jīng)進站所以沒回頭找。嗨皮...
    嗨Pi麻閱讀 264評論 0 1
  • 不知道從何時起,我開始了讀書的歷史,剛開始只是好奇,但當我看完人生中第一本書《魯賓遜漂流記》后,我仿佛看到了...
    十月桂花開閱讀 334評論 0 0

友情鏈接更多精彩內(nèi)容