Undo | Redo

undo 記錄原始數(shù)據(jù)、保證原子性(回滾到原始數(shù)據(jù))
redo 記錄新數(shù)據(jù)、保證持久性
undo、 redo 都是緩存在內(nèi)存中,需要落地到硬盤中
undo、 redo 通過緩存,減少事務(wù)中的數(shù)據(jù) IO。同時(shí)引入了 undo、 redo 持久化時(shí)的 IO

  • redo log 不是直接寫入硬盤,先寫入 redo log buffer,然后批量刷新到硬盤。
  • 并發(fā)事務(wù)會(huì)共享 redo log 的空間,當(dāng)一次刷新中同時(shí)存在提交和未提交的事務(wù)時(shí),會(huì)一并提交。在后續(xù)的提交或回滾中,redo log 之追加,不刪除
  • InnoDB 將 undo log 看做數(shù)據(jù),也會(huì)寫入到 redo log
  • 回滾本質(zhì)上也是對數(shù)據(jù)的修改,也會(huì)寫入到 redo log

Undo log

事務(wù)中有兩種類型的數(shù)據(jù)

start transaction 時(shí),原始數(shù)據(jù)記錄到 undo log 中
修改數(shù)據(jù)時(shí),數(shù)據(jù)狀態(tài)發(fā)生改變
commit 前,undo log 持久化到磁盤、數(shù)據(jù)修改后的狀態(tài)持久化到磁盤

Undo Log 是為了實(shí)現(xiàn)事務(wù)的原子性,在MySQL數(shù)據(jù)庫InnoDB存儲(chǔ)引擎中,還用Undo Log來實(shí)現(xiàn)多版本并發(fā)控制(簡稱:MVCC)。

  • 事務(wù)的原子性(Atomicity)
    事務(wù)中的所有操作,要么全部完成,要么不做任何操作,不能只做部分操作。如果在執(zhí)行的過程中發(fā)生
    了錯(cuò)誤,要回滾(Rollback)到事務(wù)開始前的狀態(tài),就像這個(gè)事務(wù)從來沒有執(zhí)行過。

  • 原理
    Undo Log的原理很簡單,為了滿足事務(wù)的原子性,在操作任何數(shù)據(jù)之前,首先將數(shù)據(jù)備份到一個(gè)地方
    (這個(gè)存儲(chǔ)數(shù)據(jù)備份的地方稱為Undo Log)。然后進(jìn)行數(shù)據(jù)的修改。如果出現(xiàn)了錯(cuò)誤或者用戶執(zhí)行了
    ROLLBACK語句,系統(tǒng)可以利用Undo Log中的備份將數(shù)據(jù)恢復(fù)到事務(wù)開始之前的狀態(tài)。

除了可以保證事務(wù)的原子性,Undo Log也可以用來輔助完成事務(wù)的持久化。

  • 事務(wù)的持久性(Durability)
    事務(wù)一旦完成,該事務(wù)對數(shù)據(jù)庫所做的所有修改都會(huì)持久的保存到數(shù)據(jù)庫中。為了保證持久性,數(shù)據(jù)庫
    系統(tǒng)會(huì)將修改后的數(shù)據(jù)完全的記錄到持久的存儲(chǔ)上。

  • 用Undo Log實(shí)現(xiàn)原子性和持久化的事務(wù)的簡化過程
    假設(shè)有A、B兩個(gè)數(shù)據(jù),值分別為1,2。
    A.事務(wù)開始.
    B.記錄A=1到undo log.
    C.修改A=3.
    D.記錄B=2到undo log.
    E.修改B=4.
    F.將undo log寫到磁盤。
    G.將數(shù)據(jù)寫到磁盤。
    H.事務(wù)提交
    這里有一個(gè)隱含的前提條件:‘?dāng)?shù)據(jù)都是先讀到內(nèi)存中,然后修改內(nèi)存中的數(shù)據(jù),最后將數(shù)據(jù)寫回磁盤’。

    之所以能同時(shí)保證原子性和持久化,是因?yàn)橐韵绿攸c(diǎn):
    A. 更新數(shù)據(jù)前記錄Undo log。
    B. 為了保證持久性,必須將數(shù)據(jù)在事務(wù)提交前寫到磁盤。只要事務(wù)成功提交,數(shù)據(jù)必然已經(jīng)持久化。
    C. Undo log必須先于數(shù)據(jù)持久化到磁盤。如果在G,H之間系統(tǒng)崩潰,undo log是完整的,
    可以用來回滾事務(wù)。
    D. 如果在A-F之間系統(tǒng)崩潰,因?yàn)閿?shù)據(jù)沒有持久化到磁盤。所以磁盤上的數(shù)據(jù)還是保持在事務(wù)開始前的狀態(tài)。

缺陷:每個(gè)事務(wù)提交前將數(shù)據(jù)和Undo Log寫入磁盤,這樣會(huì)導(dǎo)致大量的磁盤IO,因此性能很低。

如果能夠?qū)?shù)據(jù)緩存一段時(shí)間,就能減少IO提高性能。但是這樣就會(huì)喪失事務(wù)的持久性。因此引入了另外一
種機(jī)制來實(shí)現(xiàn)持久化,即Redo Log。

Redo log

  • 原理
    和Undo Log相反,Redo Log記錄的是新數(shù)據(jù)的備份。在事務(wù)提交前,只要將Redo Log持久化即可,
    不需要將數(shù)據(jù)持久化。當(dāng)系統(tǒng)崩潰時(shí),雖然數(shù)據(jù)沒有持久化,但是Redo Log已經(jīng)持久化。系統(tǒng)可以根據(jù)
    Redo Log的內(nèi)容,將所有數(shù)據(jù)恢復(fù)到最新的狀態(tài)。

  • Undo + Redo事務(wù)的簡化過程
    假設(shè)有A、B兩個(gè)數(shù)據(jù),值分別為1,2.
    A.事務(wù)開始.
    B.記錄A=1到undo log.
    C.修改A=3.
    D.記錄A=3到redo log.
    E.記錄B=2到undo log.
    F.修改B=4.
    G.記錄B=4到redo log.
    H.將redo log寫入磁盤。
    I.事務(wù)提交

  • Undo + Redo事務(wù)的特點(diǎn)
    A. 為了保證持久性,必須在事務(wù)提交前將Redo Log持久化。
    B. 數(shù)據(jù)不需要在事務(wù)提交前寫入磁盤,而是緩存在內(nèi)存中。
    C. Redo Log 保證事務(wù)的持久性。
    D. Undo Log 保證事務(wù)的原子性。
    E. 有一個(gè)隱含的特點(diǎn),數(shù)據(jù)必須要晚于redo log寫入持久存儲(chǔ)。

  • IO性能
    Undo + Redo的設(shè)計(jì)主要考慮的是提升IO性能。雖說通過緩存數(shù)據(jù),減少了寫數(shù)據(jù)的IO.
    但是卻引入了新的IO,即寫Redo Log的IO。如果Redo Log的IO性能不好,就不能起到提高性能的目的。
    為了保證Redo Log能夠有比較好的IO性能,InnoDB 的 Redo Log的設(shè)計(jì)有以下幾個(gè)特點(diǎn):

    A. 盡量保持Redo Log存儲(chǔ)在一段連續(xù)的空間上。因此在系統(tǒng)第一次啟動(dòng)時(shí)就會(huì)將日志文件的空間完全分配。
    以順序追加的方式記錄Redo Log,通過順序IO來改善性能。
    B. 批量寫入日志。日志并不是直接寫入文件,而是先寫入redo log buffer.當(dāng)需要將日志刷新到磁盤時(shí)
    (如事務(wù)提交),將許多日志一起寫入磁盤.
    C. 并發(fā)的事務(wù)共享Redo Log的存儲(chǔ)空間,它們的Redo Log按語句的執(zhí)行順序,依次交替的記錄在一起,
    以減少日志占用的空間。例如,Redo Log中的記錄內(nèi)容可能是這樣的:
    記錄1: <trx1, insert …>
    記錄2: <trx2, update …>
    記錄3: <trx1, delete …>
    記錄4: <trx3, update …>
    記錄5: <trx2, insert …>
    D. 因?yàn)镃的原因,當(dāng)一個(gè)事務(wù)將Redo Log寫入磁盤時(shí),也會(huì)將其他未提交的事務(wù)的日志寫入磁盤。
    E. Redo Log上只進(jìn)行順序追加的操作,當(dāng)一個(gè)事務(wù)需要回滾時(shí),它的Redo Log記錄也不會(huì)從
    Redo Log中刪除掉。

恢復(fù)(Recovery)

  • 恢復(fù)策略
    前面說到未提交的事務(wù)和回滾了的事務(wù)也會(huì)記錄Redo Log,因此在進(jìn)行恢復(fù)時(shí),這些事務(wù)要進(jìn)行特殊的
    的處理.有2中不同的恢復(fù)策略:

    A. 進(jìn)行恢復(fù)時(shí),只重做已經(jīng)提交了的事務(wù)。
    B. 進(jìn)行恢復(fù)時(shí),重做所有事務(wù)包括未提交的事務(wù)和回滾了的事務(wù)。然后通過Undo Log回滾那些
    未提交的事務(wù)。

  • InnoDB存儲(chǔ)引擎的恢復(fù)機(jī)制
    MySQL數(shù)據(jù)庫InnoDB存儲(chǔ)引擎使用了B策略, InnoDB存儲(chǔ)引擎中的恢復(fù)機(jī)制有幾個(gè)特點(diǎn):

    A. 在重做Redo Log時(shí),并不關(guān)心事務(wù)性。 恢復(fù)時(shí),沒有BEGIN,也沒有COMMIT,ROLLBACK的行為。
    也不關(guān)心每個(gè)日志是哪個(gè)事務(wù)的。盡管事務(wù)ID等事務(wù)相關(guān)的內(nèi)容會(huì)記入Redo Log,這些內(nèi)容只是被當(dāng)作
    要操作的數(shù)據(jù)的一部分。
    B. 使用B策略就必須要將Undo Log持久化,而且必須要在寫Redo Log之前將對應(yīng)的Undo Log寫入磁盤。
    Undo和Redo Log的這種關(guān)聯(lián),使得持久化變得復(fù)雜起來。為了降低復(fù)雜度,InnoDB將Undo Log看作
    數(shù)據(jù),因此記錄Undo Log的操作也會(huì)記錄到redo log中。這樣undo log就可以象數(shù)據(jù)一樣緩存起來,
    而不用在redo log之前寫入磁盤了。
    包含Undo Log操作的Redo Log,看起來是這樣的:
    記錄1: <trx1, Undo log insert <undo_insert …>>
    記錄2: <trx1, insert …>
    記錄3: <trx2, Undo log insert <undo_update …>>
    記錄4: <trx2, update …>
    記錄5: <trx3, Undo log insert <undo_delete …>>
    記錄6: <trx3, delete …>
    C. 到這里,還有一個(gè)問題沒有弄清楚。既然Redo沒有事務(wù)性,那豈不是會(huì)重新執(zhí)行被回滾了的事務(wù)?
    確實(shí)是這樣。同時(shí)Innodb也會(huì)將事務(wù)回滾時(shí)的操作也記錄到redo log中。回滾操作本質(zhì)上也是
    對數(shù)據(jù)進(jìn)行修改,因此回滾時(shí)對數(shù)據(jù)的操作也會(huì)記錄到Redo Log中。
    一個(gè)回滾了的事務(wù)的Redo Log,看起來是這樣的:
    記錄1: <trx1, Undo log insert <undo_insert …>>
    記錄2: <trx1, insert A…>
    記錄3: <trx1, Undo log insert <undo_update …>>
    記錄4: <trx1, update B…>
    記錄5: <trx1, Undo log insert <undo_delete …>>
    記錄6: <trx1, delete C…>
    記錄7: <trx1, insert C>
    記錄8: <trx1, update B to old value>
    記錄9: <trx1, delete A>
    一個(gè)被回滾了的事務(wù)在恢復(fù)時(shí)的操作就是先redo再undo,因此不會(huì)破壞數(shù)據(jù)的一致性.

  • InnoDB存儲(chǔ)引擎中相關(guān)的函數(shù)
    Redo: recv_recovery_from_checkpoint_start()
    Undo: recv_recovery_rollback_active()
    Undo Log的Redo Log: trx_undof_page_add_undo_rec_log()

最后編輯于
?著作權(quán)歸作者所有,轉(zhuǎn)載或內(nèi)容合作請聯(lián)系作者
【社區(qū)內(nèi)容提示】社區(qū)部分內(nèi)容疑似由AI輔助生成,瀏覽時(shí)請結(jié)合常識(shí)與多方信息審慎甄別。
平臺(tái)聲明:文章內(nèi)容(如有圖片或視頻亦包括在內(nèi))由作者上傳并發(fā)布,文章內(nèi)容僅代表作者本人觀點(diǎn),簡書系信息發(fā)布平臺(tái),僅提供信息存儲(chǔ)服務(wù)。

相關(guān)閱讀更多精彩內(nèi)容

  • 本文是介紹MySQL數(shù)據(jù)庫InnoDB存儲(chǔ)引擎重做日志漫游 00 – Undo Log Undo Log 是為了實(shí)...
    胖虎大哥閱讀 2,422評論 1 3
  • 寫在前面 本文是對于網(wǎng)上各個(gè)對redo和undo log日志解析的總結(jié),參考文章列表在最后。 事務(wù)的4大特性:原子...
    呂信閱讀 8,910評論 0 11
  • 7.1 認(rèn)識(shí)事務(wù)7.1.1 概述事務(wù)可由一條非常簡單的SQL語句組成,也可以由一組復(fù)雜的SQL語句組成。事務(wù)是訪問...
    正在加載更多閱讀 556評論 0 0
  • 今天依舊天下太平,天朗氣清,落霞與孤鶩齊飛。 嗯嗯,今天學(xué)習(xí)狀態(tài)不佳,比昨天好一點(diǎn)點(diǎn),晚飯吃得有一點(diǎn)多,驢肉火燒不...
    木風(fēng)雨閱讀 114評論 0 1
  • 老板最近忙于基金,不敢去打擾他,把匯報(bào)的ppt 做好了,今天沒有去找他,突然自己沒有底氣了,不知道自己做的有沒有價(jià)...
    慕楓秋閱讀 158評論 0 0

友情鏈接更多精彩內(nèi)容