序列化和反序列化模塊pickle介紹 | Python庫(kù)

1 前言

在“通過(guò)簡(jiǎn)單示例來(lái)理解什么是機(jī)器學(xué)習(xí)”這篇文章里提到了pickle庫(kù)的使用,本文來(lái)做進(jìn)一步的闡述。

pickle是python語(yǔ)言的一個(gè)標(biāo)準(zhǔn)模塊,安裝python后已包含pickle庫(kù),不需要單獨(dú)再安裝。

pickle模塊實(shí)現(xiàn)了基本的數(shù)據(jù)序列化和反序列化。通過(guò)pickle模塊的序列化操作我們能夠?qū)⒊绦蛑羞\(yùn)行的對(duì)象信息保存到文件中去,永久存儲(chǔ);通過(guò)pickle模塊的反序列化操作,我們能夠從文件中創(chuàng)建上一次程序保存的對(duì)象。

在官方的介紹中,序列化操作的英文描述有好幾個(gè)單詞,如"serializing", "pickling", "serialization", "marshalling" 或者"flattening"等,它們都代表的是序列化的意思。相應(yīng)的,反序列化操作的英文單詞也有好多個(gè),如"de-serializing", "unpickling", "deserailization"等。為了避免混淆,一般用"pickling"/"unpickling", 或者"serialization"/"deserailization"。

pickle模塊是以二進(jìn)制的形式序列化后保存到文件中(保存文件的后綴為".pkl"),不能直接打開(kāi)進(jìn)行預(yù)覽。而python的另一個(gè)序列化標(biāo)準(zhǔn)模塊json,則是human-readable的,可以直接打開(kāi)查看(例如在notepad++中查看)。

pickle模塊有兩類主要的接口,即序列化和反序列化。

其中序列化操作包括:

  • pickle.dump()
  • Pickler(file, protocol).dump(obj)

反序列化操作包括:

  • pickle.load()
  • Unpickler(file).load()

2 序列化操作

2.1 序列化方法pickle.dump()

序列化的方法為 pickle.dump(),該方法的相關(guān)參數(shù)如下:

pickle.dump(obj, file, protocol=None,*,fix_imports=True)

該方法實(shí)現(xiàn)的是將序列化后的對(duì)象obj以二進(jìn)制形式寫(xiě)入文件file中,進(jìn)行保存。它的功能等同于 Pickler(file, protocol).dump(obj)。

關(guān)于參數(shù)file,有一點(diǎn)需要注意,必須是以二進(jìn)制的形式進(jìn)行操作(寫(xiě)入)。
參考前文的案例如下:

import pickle

with open('svm_model_iris.pkl', 'wb') as f:
    pickle.dump(svm_classifier, f)

file為'svm_model_iris.pkl',并且以二進(jìn)制的形式('wb')寫(xiě)入。

關(guān)于參數(shù)protocol,一共有5中不同的類型,即(0,1,2,3,4)。(0,1,2)對(duì)應(yīng)的是python早期的版本,(3,4)則是在python3之后的版本。

此外,參數(shù)可選 pickle.HIGHEST_PROTOCOL和pickle.DEFAULT_PROTOCOL。當(dāng)前,python3.5版本中,pickle.HIGHEST_PROTOCOL的值為4,pickle.DEFAULT_PROTOCOL的值為3。當(dāng)protocol參數(shù)為負(fù)數(shù)時(shí),表示選擇的參數(shù)是pickle.HIGHEST_PROTOCOL。

關(guān)于參數(shù)protocol,官方的詳細(xì)介紹如下:

pickle01-s.jpg

2.2 序列化方法pickle.dumps()

pickle.dumps()方法的參數(shù)如下:

pickle.dumps(obj, protocol=None,*,fix_imports=True)

pickle.dumps()方法跟pickle.dump()方法的區(qū)別在于,pickle.dumps()方法不需要寫(xiě)入文件中,它是直接返回一個(gè)序列化的bytes對(duì)象。

2.3 序列化方法Pickler(file, protocol).dump(obj)

pickle模塊提供了序列化的面向?qū)ο蟮念惙椒ǎ?class pickle.Pickler(file, protocol=None,*,fix_imports=True),Pickler類有dump()方法。

Pickler(file, protocol).dump(obj) 實(shí)現(xiàn)的功能跟 pickle.dump() 是一樣的。

關(guān)于Pickler類的其他method,請(qǐng)參考官方API。

3 反序列化操作

3.1 反序列化方法pickle.load()

序列化的方法為 pickle.load(),該方法的相關(guān)參數(shù)如下:
pickle.load(file, *,fix_imports=True, encoding="ASCII". errors="strict")
該方法實(shí)現(xiàn)的是將序列化的對(duì)象從文件file中讀取出來(lái)。它的功能等同于 Unpickler(file).load()。

關(guān)于參數(shù)file,有一點(diǎn)需要注意,必須是以二進(jìn)制的形式進(jìn)行操作(讀?。?。
參考前文的案例如下:

import pickle

with open('svm_model_iris.pkl', 'rb') as f:
    model = pickle.load(f)

file為'svm_model_iris.pkl',并且以二進(jìn)制的形式('rb')讀取。

讀取的時(shí)候,參數(shù)protocol是自動(dòng)選擇的,load()方法中沒(méi)有這個(gè)參數(shù)。

3.2 反序列化方法pickle.loads()

pickle.loads()方法的參數(shù)如下:

pickle.loads(bytes_object, *,fix_imports=True, encoding="ASCII". errors="strict")

pickle.loads()方法跟pickle.load()方法的區(qū)別在于,pickle.loads()方法是直接從bytes對(duì)象中讀取序列化的信息,而非從文件中讀取。

3.3 反序列化方法Unpickler(file).load()

pickle模塊提供了反序列化的面向?qū)ο蟮念惙椒?,?class pickle.Unpickler(file, *,fix_imports=True, encoding="ASCII". errors="strict"),Pickler類有l(wèi)oad()方法。

Unpickler(file).load() 實(shí)現(xiàn)的功能跟 pickle.load() 是一樣的。

關(guān)于Unpickler類的其他method,請(qǐng)參考官方API。

4 那些類型可以進(jìn)行序列化和反序列化操作

官方文檔是這么介紹的,這里我就不進(jìn)一步描述了。

pickle02-s.jpg

寫(xiě)在后面

pickle模塊還是比較實(shí)用的,當(dāng)然,關(guān)于pickle模塊,其實(shí)還有許多的信息可以去了解,想了解更多信息的童鞋,建議可以閱讀下python官方的API文檔(library文件)。

由于個(gè)人精力有限,簡(jiǎn)書(shū)上文章更新較慢,實(shí)在抱歉。歡迎關(guān)注微信公眾號(hào)(ID:PyDataRoad)

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請(qǐng)聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請(qǐng)結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡(jiǎn)書(shū)系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • Spring Cloud為開(kāi)發(fā)人員提供了快速構(gòu)建分布式系統(tǒng)中一些常見(jiàn)模式的工具(例如配置管理,服務(wù)發(fā)現(xiàn),斷路器,智...
    卡卡羅2017閱讀 136,695評(píng)論 19 139
  • 0x01 前言 前兩天在安全客中看了一篇python對(duì)象注入的文章,感覺(jué)寫(xiě)的很好,就學(xué)習(xí)一下,在此記錄一下。 0x...
    Pino_HD閱讀 1,137評(píng)論 0 0
  • http://www.liaoxuefeng.com/wiki/0014316089557264a6b348958...
    喵在野閱讀 351評(píng)論 0 0
  • 開(kāi)學(xué)后的一切逐漸進(jìn)入正軌,早上六七點(diǎn)鐘聽(tīng)著鬧鈴的響聲也要脫掉假期的懶散去教室上課,手機(jī)也不是隨手捧在掌心低頭狂刷,...
    誰(shuí)動(dòng)了我的斯達(dá)舒閱讀 458評(píng)論 30 5
  • 2017年6月23日,中國(guó)音樂(lè)學(xué)院的師生們重又唱起了歌劇《小二黑結(jié)婚》,老曲新唱,平添新意。在金錢財(cái)富面現(xiàn),今人還...
    北塔雪松閱讀 1,408評(píng)論 81 215

友情鏈接更多精彩內(nèi)容