實(shí)時(shí)分析系統(tǒng)(HIVE/HBASE/IMPALA)淺析 - 大數(shù)據(jù)和云計(jì)算技術(shù) (歡迎關(guān)注同名微信公眾號(hào)) - ITeye技術(shù)網(wǎng)站
http://jiezhu2007.iteye.com/blog/2055919
- 結(jié)語(yǔ)
目前來(lái)看,業(yè)界還沒(méi)有一個(gè)完美的解決方案,通常的思路有:
a. 提前根據(jù)查詢(xún)結(jié)果來(lái)組織數(shù)據(jù)。每種業(yè)務(wù)都是不同的,要想查詢(xún)得快,就要提前分析場(chǎng)景,在數(shù)據(jù)入庫(kù)時(shí),就提前根據(jù)查詢(xún)結(jié)果來(lái)組織數(shù)據(jù)。這也是微博等應(yīng)用的做法,根據(jù)顯示結(jié)果提前存儲(chǔ)數(shù)據(jù)。
b. 對(duì)不固定維度的,多維度查詢(xún),目前來(lái)看hadoop和傳統(tǒng)的并行數(shù)據(jù)庫(kù)架構(gòu)上會(huì)有一個(gè)融合的過(guò)程,相信最后會(huì)殊途同歸,Impala還是有前途的。
c. 多查詢(xún)引擎的融合,通常我們希望一份數(shù)據(jù),可以承擔(dān)多種應(yīng)用,既可以承擔(dān)直接帶用戶(hù)id的快速查詢(xún),也系統(tǒng)可以搞定多維度的復(fù)雜分析,所以要支持多種應(yīng)用,多查詢(xún)引擎的特點(diǎn)融合不可以避免。希望后面impala可以解決在habase上性能不高的問(wèn)題。
d. 用高速硬件加速,flash卡目前越來(lái)越便宜,將需要高速查詢(xún)的數(shù)據(jù)換成到flash等高速硬件上。