Flume
1.分布式的可靠的可用的系統(tǒng),高效的從不同數(shù)據(jù)源收集聚合遷移大量數(shù)據(jù)到一個(gè)集中的數(shù)據(jù)存儲(chǔ)
2.安裝部署比較logstash復(fù)雜
3.同樣以配置文件為中心 提供了JavaAPI
4.是一個(gè)完整的基于插件的架構(gòu)有獨(dú)立開(kāi)發(fā)的第三方插件
5.三層架構(gòu):source channel sink
6.Flume使用基于事務(wù)的數(shù)據(jù)傳遞方式來(lái)保證事件傳遞的可靠性。
7.Flume的配置是真繁瑣,source,channel,sink的關(guān)系在配置文件里面交織在一起,沒(méi)有Logstash那么簡(jiǎn)單明了。
Logstash
1.Logstash比較偏重于字段的預(yù)處理;而Flume偏重?cái)?shù)據(jù)的傳輸;
2.Logstash有幾十個(gè)插件,配置靈活;FLume則是強(qiáng)調(diào)用戶(hù)的自定義開(kāi)發(fā)(source和sink的種類(lèi)也有一二十個(gè)吧,channel就比較少了)。
3.Logstash的input和filter還有output之間都存在buffer,進(jìn)行緩沖;Flume直接使用channel做持久化(可以理解為沒(méi)有filter)
4.Flume比較看重?cái)?shù)據(jù)的傳輸,因此幾乎沒(méi)有數(shù)據(jù)的解析預(yù)處理。
5.傳輸?shù)臅r(shí)候flume比logstash多考慮了一些可靠性。
Sqoop2
用于結(jié)構(gòu)化數(shù)據(jù)源(MySQL)與半結(jié)構(gòu)化(Hbase)非結(jié)構(gòu)化(HDFS)數(shù)據(jù)源之間相互轉(zhuǎn)換,是為Hadoop和關(guān)系型數(shù)據(jù)庫(kù)相互轉(zhuǎn)換的工具。
Logstash:有ELK 技術(shù)成熟 使用場(chǎng)景廣泛 數(shù)據(jù)預(yù)處理 帶緩存
Flume: 分布式 事務(wù)傳輸 配置復(fù)雜 輕量級(jí)線程
Sqoop2:Hadoop和關(guān)系型數(shù)據(jù)庫(kù)相互轉(zhuǎn)換
參考資料
goood!:聊聊Flume和Logstash的那些事兒
Logstash,flume,sqoop比較
Flume日志采集系統(tǒng)——初體驗(yàn)(Logstash對(duì)比版)