示例講解PostgreSQL表分區(qū)的三種方式

我最新最全的文章都在 南瓜慢說(shuō) www.pkslow.com ,歡迎大家來(lái)喝茶!

1 簡(jiǎn)介

表分區(qū)是解決一些因單表過(guò)大引用的性能問(wèn)題的方式,比如某張表過(guò)大就會(huì)造成查詢(xún)變慢,可能分區(qū)是一種解決方案。一般建議當(dāng)單表大小超過(guò)內(nèi)存就可以考慮表分區(qū)了。PostgreSQL的表分區(qū)有三種方式:

  • Range:范圍分區(qū);
  • List:列表分區(qū);
  • Hash:哈希分區(qū)。

本文通過(guò)示例講解如何進(jìn)行這三種方式的分區(qū)。

2 例講三種方式

為方便,我們通過(guò)Docker的方式啟動(dòng)一個(gè)PostgreSQL,可參考:《Docker啟動(dòng)PostgreSQL并推薦幾款連接工具》。我們要選擇較高的版本,否則不支持Hash分區(qū),命令如下:

docker run -itd \
    --name pkslow-postgres \
    -e POSTGRES_DB=pkslow \
    -e POSTGRES_USER=pkslow \
    -e POSTGRES_PASSWORD=pkslow \
    -p 5432:5432 \
    postgres:13

2.1 Range范圍分區(qū)

先創(chuàng)建一張表帶有年齡,然后我們根據(jù)年齡分段來(lái)進(jìn)行分區(qū),創(chuàng)建表語(yǔ)句如下:

CREATE TABLE pkslow_person_r (
    age int not null,
    city varchar not null
) PARTITION BY RANGE (age);

這個(gè)語(yǔ)句已經(jīng)指定了按age字段來(lái)分區(qū)了,接著創(chuàng)建分區(qū)表:

create table pkslow_person_r1 partition of pkslow_person_r for values from (MINVALUE) to (10);
create table pkslow_person_r2 partition of pkslow_person_r for values from (11) to (20);
create table pkslow_person_r3 partition of pkslow_person_r for values from (21) to (30);
create table pkslow_person_r4 partition of pkslow_person_r for values from (31) to (MAXVALUE);

這里創(chuàng)建了四張分區(qū)表,分別對(duì)應(yīng)年齡是0到10歲、11到20歲、21到30歲、30歲以上。

接著我們插入一些數(shù)據(jù):

insert into pkslow_person_r(age, city) VALUES (1, 'GZ');
insert into pkslow_person_r(age, city) VALUES (2, 'SZ');
insert into pkslow_person_r(age, city) VALUES (21, 'SZ');
insert into pkslow_person_r(age, city) VALUES (13, 'BJ');
insert into pkslow_person_r(age, city) VALUES (43, 'SH');
insert into pkslow_person_r(age, city) VALUES (28, 'HK');

可以看到這里的表名還是pkslow_person_r,而不是具體的分區(qū)表,說(shuō)明對(duì)于客戶(hù)端是無(wú)感知的。

我們查詢(xún)也一樣的:

但實(shí)際上是有分區(qū)表存在的:

而且分區(qū)表與主表的字段是一致的。

查詢(xún)分區(qū)表,就只能查到那個(gè)特定分區(qū)的數(shù)據(jù)了:

2.2 List列表分區(qū)

類(lèi)似的,列表分區(qū)是按特定的值來(lái)分區(qū),比較某個(gè)城市的數(shù)據(jù)放在一個(gè)分區(qū)里。這里不再給出每一步的講解,代碼如下:

-- 創(chuàng)建主表
create table pkslow_person_l (
                          age int not null,
                          city varchar not null
) partition by list (city);

-- 創(chuàng)建分區(qū)表
CREATE TABLE pkslow_person_l1 PARTITION OF pkslow_person_l FOR VALUES IN ('GZ');
CREATE TABLE pkslow_person_l2 PARTITION OF pkslow_person_l FOR VALUES IN ('BJ');
CREATE TABLE pkslow_person_l3 PARTITION OF pkslow_person_l DEFAULT;

-- 插入測(cè)試數(shù)據(jù)
insert into pkslow_person_l(age, city) VALUES (1, 'GZ');
insert into pkslow_person_l(age, city) VALUES (2, 'SZ');
insert into pkslow_person_l(age, city) VALUES (21, 'SZ');
insert into pkslow_person_l(age, city) VALUES (13, 'BJ');
insert into pkslow_person_l(age, city) VALUES (43, 'SH');
insert into pkslow_person_l(age, city) VALUES (28, 'HK');
insert into pkslow_person_l(age, city) VALUES (28, 'GZ');

當(dāng)我們查詢(xún)第一個(gè)分區(qū)的時(shí)候,只有廣州的數(shù)據(jù):

2.3 Hash哈希分區(qū)

哈希分區(qū)是指按字段取哈希值后再分區(qū)。具體的語(yǔ)句如下:

-- 創(chuàng)建主表
create table pkslow_person_h (
                          age int not null,
                          city varchar not null
) partition by hash (city);

-- 創(chuàng)建分區(qū)表
create table pkslow_person_h1 partition of pkslow_person_h for values with (modulus 4, remainder 0);
create table pkslow_person_h2 partition of pkslow_person_h for values with (modulus 4, remainder 1);
create table pkslow_person_h3 partition of pkslow_person_h for values with (modulus 4, remainder 2);
create table pkslow_person_h4 partition of pkslow_person_h for values with (modulus 4, remainder 3);

-- 插入測(cè)試數(shù)據(jù)
insert into pkslow_person_h(age, city) VALUES (1, 'GZ');
insert into pkslow_person_h(age, city) VALUES (2, 'SZ');
insert into pkslow_person_h(age, city) VALUES (21, 'SZ');
insert into pkslow_person_h(age, city) VALUES (13, 'BJ');
insert into pkslow_person_h(age, city) VALUES (43, 'SH');
insert into pkslow_person_h(age, city) VALUES (28, 'HK');

可以看到創(chuàng)建分區(qū)表的時(shí)候,我們用了取模的方式,所以如果要?jiǎng)?chuàng)建N個(gè)分區(qū)表,就要取N取模。

隨便查詢(xún)一張分區(qū)表如下:

可以看到同是SZ的哈希值是一樣的,肯定會(huì)分在同一個(gè)分區(qū),而B(niǎo)J的哈希值取模后也屬于同一個(gè)分區(qū)。

3 總結(jié)

本文講解了PostgreSQL分區(qū)的三種方式。

代碼請(qǐng)查看:https://github.com/LarryDpk/pkslow-samples

?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容