數(shù)倉初探

image.png

’## 數(shù)倉特征:

  • 面前主題:數(shù)據(jù)分析問題,一個主題對應(yīng)一個分析領(lǐng)域,如:用戶行為
  • 集成:面向企業(yè)級的數(shù)據(jù),數(shù)據(jù)具有完整性,一致性,精準(zhǔn)性
  • 變化:相對歷史變化
  • 穩(wěn)定:相對固定時間段數(shù)據(jù)穩(wěn)定,無非冪等性操作

相對業(yè)務(wù)數(shù)據(jù)庫區(qū)別

name 數(shù)倉 業(yè)務(wù)數(shù)據(jù)
狀態(tài) 相對歷史變化,當(dāng)前穩(wěn)定 實時變化
設(shè)計思想 違范式,冗余 范式,避免冗余
應(yīng)用場景 面向分析 面向業(yè)務(wù)交易
處理量 高吞吐,有延遲 高并發(fā),低延遲

建模步驟

業(yè)務(wù)模型 -----> 領(lǐng)域模型 ------> 邏輯模型 -------> 物理模型

  • 業(yè)務(wù)模型:對實際業(yè)務(wù)進行切切分,分解,如:電商網(wǎng)站,分解為交易模塊,展示模塊,物流模塊
  • 領(lǐng)域模型:問自己5維度W,Who,Where,What,When,WHY
  • 邏輯模型:進行事實,度量,維度,實體間關(guān)系的構(gòu)建
  • 物理模型: 具體數(shù)據(jù)庫的字段類型,長度,約束等

建模方法

  • 三范式建模
    - 1NF 屬性不可分,屬性原子性
    - 2NF 非主屬性完全依賴主屬性
    - 3NF 不存在傳遞依賴
  • 維度建模
    - 星型模型維度有冗余
    - 雪花模型做更細(xì)粒度的維度
  • 實體建模
    將現(xiàn)實世界映射為:
    - 實體
    - 事件
    - 說明

建模方法選擇

業(yè)務(wù)模型,領(lǐng)域模型階段使用實體建模,基于事件分析
邏輯模型階段使用維度建模

維度建模方法:

  • 選擇業(yè)務(wù)過程
  • 聲明粒度
  • 確定維度
  • 確定事實表

動詞:事實表, 如: 啟動App,觀看視頻
名詞:維度,如:地域,日期

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點,簡書系信息發(fā)布平臺,僅提供信息存儲服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容