
image.png
’## 數(shù)倉特征:
- 面前主題:數(shù)據(jù)分析問題,一個主題對應(yīng)一個分析領(lǐng)域,如:用戶行為
- 集成:面向企業(yè)級的數(shù)據(jù),數(shù)據(jù)具有完整性,一致性,精準(zhǔn)性
- 變化:相對歷史變化
- 穩(wěn)定:相對固定時間段數(shù)據(jù)穩(wěn)定,無非冪等性操作
相對業(yè)務(wù)數(shù)據(jù)庫區(qū)別
| name | 數(shù)倉 | 業(yè)務(wù)數(shù)據(jù) |
|---|---|---|
| 狀態(tài) | 相對歷史變化,當(dāng)前穩(wěn)定 | 實時變化 |
| 設(shè)計思想 | 違范式,冗余 | 范式,避免冗余 |
| 應(yīng)用場景 | 面向分析 | 面向業(yè)務(wù)交易 |
| 處理量 | 高吞吐,有延遲 | 高并發(fā),低延遲 |
建模步驟
業(yè)務(wù)模型 -----> 領(lǐng)域模型 ------> 邏輯模型 -------> 物理模型
- 業(yè)務(wù)模型:對實際業(yè)務(wù)進行切切分,分解,如:電商網(wǎng)站,分解為交易模塊,展示模塊,物流模塊
- 領(lǐng)域模型:問自己5維度W,Who,Where,What,When,WHY
- 邏輯模型:進行事實,度量,維度,實體間關(guān)系的構(gòu)建
- 物理模型: 具體數(shù)據(jù)庫的字段類型,長度,約束等
建模方法
-
三范式建模
- 1NF 屬性不可分,屬性原子性
- 2NF 非主屬性完全依賴主屬性
- 3NF 不存在傳遞依賴 -
維度建模
- 星型模型維度有冗余
- 雪花模型做更細(xì)粒度的維度 -
實體建模
將現(xiàn)實世界映射為:
- 實體
- 事件
- 說明
建模方法選擇
業(yè)務(wù)模型,領(lǐng)域模型階段使用實體建模,基于事件分析
邏輯模型階段使用維度建模
維度建模方法:
- 選擇業(yè)務(wù)過程
- 聲明粒度
- 確定維度
- 確定事實表
動詞:事實表, 如: 啟動App,觀看視頻
名詞:維度,如:地域,日期