關(guān)于UUID的二三事

[TOC]

一、簡介

UUID,是Universally Unique Identifier的縮寫,UUID出現(xiàn)的目的,是為了讓分布式系統(tǒng)可以不借助中心節(jié)點(diǎn),就可以生成UUID來標(biāo)識一些唯一的信息;

GUID,是Globally Unique Identifier的縮寫,跟UUID是同一個(gè)東西,只是來源于微軟。

規(guī)范定義

UUID來自于IETF發(fā)布的一個(gè)規(guī)范:A Universally Unique IDentifier (UUID) URN Namespace

UUID來源于OSF的DCE規(guī)范,也就是RFC4122的前身

GUID來源于微軟,注意RFC4122的作者之一是微軟員工

下面摘錄一下,RFC4144中的Abstract

This specification defines a Uniform Resource Name namespace for
UUIDs (Universally Unique IDentifier), also known as GUIDs (Globally
Unique IDentifier).  A UUID is 128 bits long, and can guarantee
uniqueness across space and time.  UUIDs were originally used in the
Apollo Network Computing System and later in the Open Software
Foundation's (OSF) Distributed Computing Environment (DCE), and then
in Microsoft Windows platforms.

This specification is derived from the DCE specification with the
kind permission of the OSF (now known as The Open Group).
Information from earlier versions of the DCE specification have been
incorporated into this document.

不知道起什么標(biāo)題好

1個(gè)UUID是1個(gè)16字節(jié)(128位)的數(shù)字;為了方便閱讀,通常將UUID表示成如下的方式:

123e4567-e89b-12d3-a456-426655440000

1個(gè)UUID被連字符分為五段,形式為8-4-4-4-12的32個(gè)字符。

其中的字母是16進(jìn)制表示,大小寫無關(guān)。

二、不同的版本

UUID本身也經(jīng)過了多個(gè)版本的演化,每個(gè)版本的算法都不同。

標(biāo)準(zhǔn)格式

UUID的格式是這樣的:xxxxxxxx-xxxx-Mxxx-Nxxx-xxxxxxxxxxxx

N那個(gè)位置,只會(huì)是8,9,a,b

M那個(gè)位置,代表版本號,由于UUID的標(biāo)準(zhǔn)實(shí)現(xiàn)有5個(gè)版本,所以只會(huì)是1,2,3,4,5

各個(gè)版本簡介

版本1:基于時(shí)間的UUID

通過當(dāng)前時(shí)間戳、機(jī)器MAC地址生成;

由于在算法中使用了MAC地址,這個(gè)版本的UUID可以保證在全球范圍的唯一性。

但與此同時(shí),因?yàn)樗┞读穗娔X的MAC地址和生成這個(gè)UUID的時(shí)間,這就是這個(gè)版本UUID被詬病的地方。

在python里面的使用的例子:

>>> import uuid
>>> uuid.uuid1()
UUID('444b5cc0-ae5d-11e6-8d22-28924a431726')
>>> uuid.uuid1()
UUID('46a9bf21-ae5d-11e6-9549-28924a431726')

其中,最后的12個(gè)字符28924a431726就是我電腦網(wǎng)卡的MAC地址

版本2:DCE安全的UUID

DCE安全的UUID和基于時(shí)間的UUID算法相同,但會(huì)把時(shí)間戳的前4位置換為POSIX的UID或GID。

不過,在UUID的規(guī)范里面沒有明確地指定,所以基本上所有的UUID實(shí)現(xiàn)都不會(huì)實(shí)現(xiàn)這個(gè)版本。

版本3:基于名字空間的UUID(MD5)

由用戶指定1個(gè)namespace和1個(gè)具體的字符串,通過MD5散列,來生成1個(gè)UUID;

根據(jù)規(guī)范描述,這個(gè)版本的存在是為了向后兼容?平時(shí)這個(gè)版本我們也很少用到

在python里面的使用的例子:

>>> import uuid
>>> uuid.uuid3(uuid.NAMESPACE_DNS, "myString")
UUID('21fc48e5-63f0-3849-8b9d-838a012a5936')
>>> uuid.uuid3(uuid.NAMESPACE_DNS, "myString")
UUID('21fc48e5-63f0-3849-8b9d-838a012a5936')

在java中使用的例子

System.out.println(UUID.nameUUIDFromBytes("myString".getBytes("UTF-8")).toString());

Java只支持生成版本3和版本4的UUID

版本4:基于隨機(jī)數(shù)的UUID

根據(jù)隨機(jī)數(shù),或者偽隨機(jī)數(shù)生成UUID。這種UUID產(chǎn)生重復(fù)的概率是可以計(jì)算出來的,但隨機(jī)的東西就像是買彩票:你指望它發(fā)財(cái)是不可能的,但狗屎運(yùn)通常會(huì)在不經(jīng)意中到來。這個(gè)版本應(yīng)該是平時(shí)大家無意中用得最多的版本了;

在python里面使用的例子:

>>> import uuid
>>> uuid.uuid4()
UUID('e584539d-a334-4f15-9819-88d73fcf707d')
>>> uuid.uuid4()
UUID('76ec02cc-1b1d-4ad3-bd09-a4f6d67c7af4')

以及Java中大家最熟悉的:

System.out.println(UUID.randomUUID().toString());
版本5:基于名字空間的UUID(SHA1)

和版本3一樣,不過散列函數(shù)換成了SHA1

在python里面的使用的例子:

>>> import uuid
>>> uuid.uuid5(uuid.NAMESPACE_DNS, "myString")
UUID('cd086011-6aac-5a06-a94a-0b67c59649ba')
>>> uuid.uuid5(uuid.NAMESPACE_DNS, "myString")
UUID('cd086011-6aac-5a06-a94a-0b67c59649ba')

三、UUID的應(yīng)用

從幾個(gè)版本的定義來看,感覺都不是特別完美,可能版本4是平時(shí)用得最多的,但是在現(xiàn)實(shí)的業(yè)務(wù)場景中,考慮到可讀性、唯一性、長度,我們一般也不會(huì)選擇UUID當(dāng)做數(shù)據(jù)庫的主鍵。

至于其他場景的應(yīng)用,可以結(jié)合具體的場景,來使用各個(gè)版本的實(shí)現(xiàn)。

四、UUID和各個(gè)編程語言

參考:

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識與多方信息審慎甄別。
平臺聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺,僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容