微信搜索“java進(jìn)階架構(gòu)師”,選擇“置頂公眾號(hào)”更多精彩文章
20大進(jìn)階架構(gòu)專題每日送達(dá)
一、背景
隨著時(shí)間和業(yè)務(wù)的發(fā)展,數(shù)據(jù)庫中的數(shù)據(jù)量增長是不可控的,庫和表中的數(shù)據(jù)會(huì)越來越大,隨之帶來的是更高的磁盤、IO、系統(tǒng)開銷,甚至性能上的瓶頸,而一臺(tái)服務(wù)的資源終究是有限的,因此需要對(duì)數(shù)據(jù)庫和表進(jìn)行拆分,從而更好的提供數(shù)據(jù)服務(wù)。
當(dāng)用戶表達(dá)到千萬級(jí)別,在做很多操作的時(shí)候都會(huì)很吃力,所以當(dāng)數(shù)據(jù)增長到1000萬以上就需要分庫分表來緩解單庫(表)的壓力。
二、什么是分庫分表[1]
簡(jiǎn)單來說,就是指通過某種特定的條件,將我們存放在同一個(gè)數(shù)據(jù)庫中的數(shù)據(jù)分散存放到多個(gè)數(shù)據(jù)庫(主機(jī))上面,以達(dá)到分散單臺(tái)設(shè)備負(fù)載的效果。
數(shù)據(jù)的切分(Sharding)根據(jù)其切分規(guī)則的類型,可以分為兩種切分模式。一種是按照不同的表(或者Schema)來切分到不同的數(shù)據(jù)庫(主機(jī))之上,這種切可以稱之為數(shù)據(jù)的垂直(縱向)切分;另外一種則是根據(jù)表中的數(shù)據(jù)的邏輯關(guān)系,將同一個(gè)表中的數(shù)據(jù)按照某種條件拆分到多臺(tái)數(shù)據(jù)庫(主機(jī))上面,這種切分稱之為數(shù)
據(jù)的水平(橫向)切分。
垂直切分的最大特點(diǎn)就是規(guī)則簡(jiǎn)單,實(shí)施也更為方便,尤其適合各業(yè)務(wù)之間的耦合度非常低,相互影響很小,業(yè)務(wù)邏輯非常清晰的系統(tǒng)。在這種系統(tǒng)中,可以很容易做到將不同業(yè)務(wù)模塊所使用的表分拆到不同的數(shù)據(jù)庫中。根據(jù)不同的表來進(jìn)行拆分,對(duì)應(yīng)用程序的影響也更小,拆分規(guī)則也會(huì)比較簡(jiǎn)單清晰。
水平切分于垂直切分相比,相對(duì)來說稍微復(fù)雜一些。因?yàn)橐獙⑼粋€(gè)表中的不同數(shù)據(jù)拆分到不同的數(shù)據(jù)庫中,對(duì)于應(yīng)用程序來說,拆分規(guī)則本身就較根據(jù)表名來拆分更為復(fù)雜,后期的數(shù)據(jù)維護(hù)也會(huì)更為復(fù)雜一些。
三、垂直切分 [1]
個(gè)數(shù)據(jù)庫由很多表的構(gòu)成,每個(gè)表對(duì)應(yīng)著不同的業(yè)務(wù),垂直切分是指按照業(yè)務(wù)將表進(jìn)行分類,分布到不同
的數(shù)據(jù)庫上面,這樣也就將數(shù)據(jù)或者說壓力分擔(dān)到不同的庫上面,如下圖:
系統(tǒng)被切分成了,用戶,訂單交易,支付幾個(gè)模塊。
一個(gè)架構(gòu)設(shè)計(jì)較好的應(yīng)用系統(tǒng),其總體功能肯定是由很多個(gè)功能模塊所組成的,而每一個(gè)功能模塊所需要的數(shù)據(jù)對(duì)應(yīng)到數(shù)據(jù)庫中就是一個(gè)或者多個(gè)表。而在架構(gòu)設(shè)計(jì)中,各個(gè)功能模塊相互之間的交互點(diǎn)越統(tǒng)一越少,系統(tǒng)的耦合度就越低,系統(tǒng)各個(gè)模塊的維護(hù)性以及擴(kuò)展性也就越好。這樣的系統(tǒng),實(shí)現(xiàn)數(shù)據(jù)的垂直切分也就越容易。
但是往往系統(tǒng)之有些表難以做到完全的獨(dú)立,存在這擴(kuò)庫 join 的情況,對(duì)于這類的表,就需要去做平衡,是數(shù)據(jù)庫讓步業(yè)務(wù),共用一個(gè)數(shù)據(jù)源,還是分成多個(gè)庫,業(yè)務(wù)之間通過接口來做調(diào)用。在系統(tǒng)初期,數(shù)據(jù)量比較少,或者資源有限的情況下,會(huì)選擇共用數(shù)據(jù)源,但是當(dāng)數(shù)據(jù)發(fā)展到了一定的規(guī)模,負(fù)載很大的情況,就需
要必須去做分割。
一般來講業(yè)務(wù)存在著復(fù)雜 join 的場(chǎng)景是難以切分的,往往業(yè)務(wù)獨(dú)立的易于切分。如何切分,切分到何種
程度是考驗(yàn)技術(shù)架構(gòu)的一個(gè)難題。
下面來分析下垂直切分的優(yōu)缺點(diǎn):
優(yōu)點(diǎn):
拆分后業(yè)務(wù)清晰,拆分規(guī)則明確;
系統(tǒng)之間整合或擴(kuò)展容易;
數(shù)據(jù)維護(hù)簡(jiǎn)單。
缺點(diǎn):
部分業(yè)務(wù)表無法 join,只能通過接口方式解決,提高了系統(tǒng)復(fù)雜度;
受每種業(yè)務(wù)不同的限制存在單庫性能瓶頸,不易數(shù)據(jù)擴(kuò)展跟性能提高;
事務(wù)處理復(fù)雜。
由于垂直切分是按照業(yè)務(wù)的分類將表分散到不同的庫,所以有些業(yè)務(wù)表會(huì)過于龐大,存在單庫讀寫與存儲(chǔ)瓶頸,所以就需要水平拆分來做解決。
四、水平切分 [1]
相對(duì)于垂直拆分,水平拆分不是將表做分類,而是按照某個(gè)字段的某種規(guī)則來分散到多個(gè)庫之中,每個(gè)表中包含一部分?jǐn)?shù)據(jù)。簡(jiǎn)單來說,我們可以將數(shù)據(jù)的水平切分理解為是按照數(shù)據(jù)行的切分,就是將表中的某些行切分到一個(gè)數(shù)據(jù)庫,而另外的某些行又切分到其他的數(shù)據(jù)庫中,如圖
拆分?jǐn)?shù)據(jù)就需要定義分片規(guī)則。關(guān)系型數(shù)據(jù)庫是行列的二維模型,拆分的第一原則是找到拆分維度。比如:
從會(huì)員的角度來分析,商戶訂單交易類系統(tǒng)中查詢會(huì)員某天某月某個(gè)訂單,那么就需要按照會(huì)員結(jié)合日期來拆分,不同的數(shù)據(jù)按照會(huì)員 ID 做分組,這樣所有的數(shù)據(jù)查詢 join 都會(huì)在單庫內(nèi)解決;如果從商戶的角度來講,要查詢某個(gè)商家某天所有的訂單數(shù),就需要按照商戶 ID 做拆分;但是如果系統(tǒng)既想按會(huì)員拆分,又想按商家數(shù)據(jù),則會(huì)有一定的困難。如何找到合適的分片規(guī)則需要綜合考慮衡。
幾種典型的分片規(guī)則包括:
按照用戶 ID 求模,將數(shù)據(jù)分散到不同的數(shù)據(jù)庫,具有相同數(shù)據(jù)用戶的數(shù)據(jù)都被分散到一個(gè)庫中;
按照日期,將不同月甚至日的數(shù)據(jù)分散到不同的庫中;
按照某個(gè)特定的字段求摸,或者根據(jù)特定范圍段分散到不同的庫中。
如圖,切分原則都是根據(jù)業(yè)務(wù)找到適合的切分規(guī)則分散到不同的庫,下面用用戶 ID 求模舉
既然數(shù)據(jù)做了拆分有優(yōu)點(diǎn)也就優(yōu)缺點(diǎn)。
優(yōu)點(diǎn):
拆分規(guī)則抽象好,join 操作基本可以數(shù)據(jù)庫做;
不存在單庫大數(shù)據(jù),高并發(fā)的性能瓶頸;
應(yīng)用端改造較少;
提高了系統(tǒng)的穩(wěn)定性跟負(fù)載能力。
缺點(diǎn):
拆分規(guī)則難以抽象;
分片事務(wù)一致性難以解決;
數(shù)據(jù)多次擴(kuò)展難度跟維護(hù)量極大;
跨庫 join 性能較差
五、什么是Mycat
它是一個(gè)開源的分布式數(shù)據(jù)庫系統(tǒng),是一個(gè)實(shí)現(xiàn)了 MySQL 協(xié)議的的
Server,前端用戶可以把它看作是一個(gè)數(shù)據(jù)庫代理,用 MySQL 客戶端工具和命令行訪問,而其后端可以用MySQL 原生(Native)協(xié)議與多個(gè) MySQL 服務(wù)器通信,也可以用 JDBC 協(xié)議與大多數(shù)主流數(shù)據(jù)庫服務(wù)器通信,其核心功能是分表分庫,即將一個(gè)大表水平分割為 N 個(gè)小表,存儲(chǔ)在后端 MySQL 服務(wù)器里或者其他數(shù)據(jù)庫里。
常見應(yīng)用場(chǎng)景:
單純的讀寫分離,此時(shí)配置最為簡(jiǎn)單,支持讀寫分離,主從切換;
分表分庫,對(duì)于超過 1000 萬的表進(jìn)行分片,最大支持 1000 億的單表分片;
多租戶應(yīng)用,每個(gè)應(yīng)用一個(gè)庫,但應(yīng)用程序只連接 Mycat,從而不改造程序本身,實(shí)現(xiàn)多租戶化;
報(bào)表系統(tǒng),借助于 Mycat 的分表能力,處理大規(guī)模報(bào)表的統(tǒng)計(jì);? 替代 Hbase,分析大數(shù)據(jù);
作為海量數(shù)據(jù)實(shí)時(shí)查詢的一種簡(jiǎn)單有效方案,比如 100 億條頻繁查詢的記錄需要在 3 秒內(nèi)查詢出來結(jié)果,除了基于主鍵的查詢,還可能存在范圍查詢或其他屬性查詢,此時(shí) Mycat 可能是最簡(jiǎn)單有效的選
六、SpringBoot+Mycat+MySQL實(shí)現(xiàn)分表分庫案例
關(guān)于分庫分表,Mycat已經(jīng)幫我們?cè)趦?nèi)部實(shí)現(xiàn)了路由的功能,我們只需要在Mycat中配置以下切分規(guī)則即可,對(duì)于開發(fā)者來說,我們就可以把Mycat看做是一個(gè)數(shù)據(jù)庫,接下來我們開始搭建環(huán)境:
步驟一:
Mycat是使用java寫的數(shù)據(jù)庫中間件,所以要運(yùn)行Mycat前要準(zhǔn)備要jdk的環(huán)境,要求是jdk1.7以上的環(huán)境。所以需要在系統(tǒng)中配置JAVA_HOME的環(huán)境變量.
步驟二:
從官網(wǎng)下載Mycat,http://dl.mycat.io/1.6-RELEASE/我們是基于CentOS7來搭建Mycat環(huán)境的,所以下載版本:
Mycat-server-1.6-RELEASE-20161028204710-linux.tar.gz
步驟三:
將下載好的安裝包上傳到服務(wù)器上并解壓.解壓之后目錄結(jié)構(gòu)如下:
步驟四:
配置切分規(guī)則:
將如下配置復(fù)制粘貼覆蓋mycat/conf/schema.xml的內(nèi)容。
<?xml version="1.0"?>
<!DOCTYPE mycat:schema SYSTEM "schema.dtd">
?
<!-- 設(shè)置dataNode 對(duì)應(yīng)的數(shù)據(jù)庫,及 mycat 連接的地址dataHost -->?
?
??
<!-- mycat 邏輯主機(jī)dataHost對(duì)應(yīng)的物理主機(jī).其中也設(shè)置對(duì)應(yīng)的mysql登陸信息 -->?
?
select user()?
?
?<schema>:表示的是在mycat中的邏輯庫配置,邏輯庫名稱為:TESTDB
<table>:表示在mycat中的邏輯表配置,邏輯表名稱為:user,映射到兩個(gè)數(shù)據(jù)庫節(jié)點(diǎn)dataNode中,切分規(guī)則為:rule1(在rule.xml配置)
<dataNode>:表示數(shù)據(jù)庫節(jié)點(diǎn),這個(gè)節(jié)點(diǎn)不一定是單節(jié)點(diǎn),可以配置成讀寫分離.
<dataHost>:真實(shí)的數(shù)據(jù)庫的地址配置
<heartbeat>:用戶心跳檢測(cè)
<writeHost>:寫庫的配置
將如下配置復(fù)制粘貼覆蓋mycat/conf/rule.xml的內(nèi)容。
<?xml version="1.0"?encoding="UTF-8"?>
<!DOCTYPE mycat:rule SYSTEM "rule.dtd">
id
mod-long
<!-- how many data nodes -->
2
這里定義的是切分規(guī)則,是按照id列進(jìn)行切分,切分規(guī)則是采取取模的方式,
<property name="count">2</property>:這里配置了我們有拆分了多個(gè)庫(表),需要和前面配置
<table name="user" primaryKey="id" dataNode="dn01,dn02" rule="rule1" />
中的dataNode個(gè)數(shù)一致,否則會(huì)出錯(cuò).
步驟五:
在數(shù)據(jù)庫中創(chuàng)建兩個(gè)數(shù)據(jù)庫db01,db02.
每個(gè)庫中執(zhí)行如下建表語句:
CREATE?TABLE?`user`?(
`id`?bigint(20)?NOT?NULL,
`name`?varchar(255)?DEFAULT?NULL,
PRIMARY?KEY?(`id`)
)?ENGINE=InnoDB?DEFAULT?CHARSET=utf8;
步驟六:
啟動(dòng)mycat,執(zhí)行mycat/bin/startup_nowrap.sh
步驟七:
項(xiàng)目已經(jīng)上傳到github
https://github.com/javalanxiongwei/springboot-mycat
搭建SpringBoot環(huán)境,執(zhí)行插入語句.
application.properties配置如下:
#配置數(shù)據(jù)源
spring.datasource.druid.driver-class-name=com.mysql.jdbc.Driver
#這里配置的是Mycat中server.xml中配置賬號(hào)密碼,不是數(shù)據(jù)庫的密碼。
spring.datasource.druid.username=root
spring.datasource.druid.password=123456
#mycat的邏輯庫 端口也是mycat的
spring.datasource.druid.url=jdbc:mysql://192.168.142.129:8066/TESTDB
UserMapper.java代碼如下:
@Mapper
public?interface?UserMapper {
@Insert("insert into user(id,name) value (#{id},#{name})")
int insert(User user);
@Select("select * from user")
List selectAll();
}
UserController.java代碼如下:
@RestController
@RequestMapping("/user")
public?class?UserController {
@Autowired
private?UserMapper userMapper;
@RequestMapping("/save")
public?String?save(User user){
userMapper.insert(user);
return?"保存成功";
}
@RequestMapping("/list")
public?List list(){
return?userMapper.selectAll();
}
}
步驟八:
測(cè)試:
在地址欄輸入:
http://localhost:8080/user/save?id=1&name=tom
http://localhost:8080/user/save?id=2&name=jack
查看數(shù)據(jù)庫發(fā)現(xiàn):
id為1的數(shù)據(jù)插入到數(shù)據(jù)庫db02中的user表。
id為2的數(shù)據(jù)插入到數(shù)據(jù)庫db01中的user表。
在地址欄輸入:
http://localhost:8080/user/list
是可以看到剛剛插入的兩條記錄.
好到這一步我們就已經(jīng)完成了分表分庫了.
參考mycat-definitive-guide.pdf。 ? ? ?
作者:叩丁狼教育 藍(lán)雄威
鏈接:http://m.itdecent.cn/p/f81422b1c915