實(shí)時(shí)分析系統(tǒng)(HIVE/HBASE/IMPALA)淺析

實(shí)時(shí)分析系統(tǒng)(HIVE/HBASE/IMPALA)淺析 - 大數(shù)據(jù)和云計(jì)算技術(shù) (歡迎關(guān)注同名微信公眾號(hào)) - ITeye技術(shù)網(wǎng)站
http://jiezhu2007.iteye.com/blog/2055919

  1. 結(jié)語(yǔ)
    目前來(lái)看,業(yè)界還沒(méi)有一個(gè)完美的解決方案,通常的思路有:
    a. 提前根據(jù)查詢(xún)結(jié)果來(lái)組織數(shù)據(jù)。每種業(yè)務(wù)都是不同的,要想查詢(xún)得快,就要提前分析場(chǎng)景,在數(shù)據(jù)入庫(kù)時(shí),就提前根據(jù)查詢(xún)結(jié)果來(lái)組織數(shù)據(jù)。這也是微博等應(yīng)用的做法,根據(jù)顯示結(jié)果提前存儲(chǔ)數(shù)據(jù)。
    b. 對(duì)不固定維度的,多維度查詢(xún),目前來(lái)看hadoop和傳統(tǒng)的并行數(shù)據(jù)庫(kù)架構(gòu)上會(huì)有一個(gè)融合的過(guò)程,相信最后會(huì)殊途同歸,Impala還是有前途的。
    c. 多查詢(xún)引擎的融合,通常我們希望一份數(shù)據(jù),可以承擔(dān)多種應(yīng)用,既可以承擔(dān)直接帶用戶(hù)id的快速查詢(xún),也系統(tǒng)可以搞定多維度的復(fù)雜分析,所以要支持多種應(yīng)用,多查詢(xún)引擎的特點(diǎn)融合不可以避免。希望后面impala可以解決在habase上性能不高的問(wèn)題。
    d. 用高速硬件加速,flash卡目前越來(lái)越便宜,將需要高速查詢(xún)的數(shù)據(jù)換成到flash等高速硬件上。
最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容