99人妻操,激情宗合网在线观看,欧美妓啪啪

摘要：

????????隨著每比特價(jià)格的下降，SSD越來(lái)越成為云應(yīng)用數(shù)據(jù)庫(kù)中熱數(shù)據(jù)的默認(rèn)存儲(chǔ)介質(zhì)。盡管SSD的每位價(jià)格低于10倍，并且與DRAM相比，它提供了足夠的性能（當(dāng)通過(guò)網(wǎng)絡(luò)訪問(wèn)時(shí)），但閃存的耐用性限制了其在大量使用情況下的應(yīng)用，例如鍵值緩存。這是因?yàn)殒I值緩存需要經(jīng)常插入，更新和逐出小對(duì)象。這會(huì)導(dǎo)致閃存存儲(chǔ)器的寫入和擦除過(guò)多，從而大大縮短閃存的使用壽命。我們介紹Flashield，一種混合??鍵值緩存，它使用DRAM作為“過(guò)濾器”來(lái)控制和限制對(duì)SSD的寫入。Flashield執(zhí)行輕量級(jí)機(jī)器學(xué)習(xí)準(zhǔn)入控制，以預(yù)測(cè)哪些對(duì)象可能經(jīng)常被讀取而無(wú)需更新;?這些對(duì)象，哪些是存儲(chǔ)在SSD上的主要候選者，順序地以大塊寫入SSD。我們描述了Flashield的設(shè)計(jì)和實(shí)現(xiàn)，并使用廣泛使用的緩存服務(wù)Memcachier對(duì)實(shí)際痕跡進(jìn)行評(píng)估。我們?yōu)榇鎯?chǔ)在閃存中的可變大小的對(duì)象設(shè)計(jì)了一種新穎的內(nèi)存索引，在DRAM中每個(gè)對(duì)象只需要4個(gè)字節(jié)。與具有2.5倍或更高寫入放大率的最先進(jìn)系統(tǒng)相比，F(xiàn)lashield保持0.5倍的中值寫入放大率（因?yàn)樵S多濾波對(duì)象根本不會(huì)寫入閃存），而沒(méi)有任何命中率損失或吞吐量。

背景：

????????與DRAM相比，F(xiàn)lash的每比特成本要低一個(gè)數(shù)量級(jí)。因此，對(duì)于需要高吞吐量和低延遲的熱數(shù)據(jù)，它已經(jīng)成為首選的存儲(chǔ)介質(zhì)。例如，谷歌[36]和Face-book[30]使用它存儲(chǔ)照片，而像Lev-elDB[5]和RocksDB[9]這樣的數(shù)據(jù)庫(kù)部署在flash之上。

? ??????????鍵值緩存是現(xiàn)代web規(guī)模應(yīng)用程序中的一個(gè)重要層，幾乎被所有web服務(wù)(包括Facebook、Twitter和Airbnb)廣泛使用。大型web服務(wù)提供者運(yùn)行自己的鍵值緩存集群，而較小的提供者通常使用緩存即服務(wù)的功能，如Amazon ElastiCache[1]和Memcachier[7]。

? ??????然而，由于它在寫操作下的持久性有限，flash通常不用于像memcached[6]和Redis[8]這樣的鍵值緩存。這就更加令人困惑了，因?yàn)檫@些緩存通常部署在一個(gè)專用的remote集群[31]或遠(yuǎn)程數(shù)據(jù)中心[1,7]中，或者使用客戶端批處理[31]。因此，客戶端觀察到的訪問(wèn)時(shí)間可以是數(shù)百微秒到毫秒，因此與使用DRAM相比，flash只會(huì)增加一小部分延遲。

? ??????此外，由于緩存的性能主要是由它們提供的內(nèi)存容量決定的[13,14]，而且SSD的每比特成本比DRAM低10多美元，與DRAM相比，flash有望帶來(lái)顯著的經(jīng)濟(jì)效益。表1顯示，只有DRAM緩存和混合緩存(都具有4.25 TB的容量)之間的成本差異大于10。由于電力成本的原因，總擁有成本(TCO)的差異將會(huì)更大，因?yàn)閒lash消耗的電力比DRAM要少得多，而且可以在請(qǐng)求更少時(shí)關(guān)閉，而不需要重新預(yù)熱緩存。

??????????flash沒(méi)有被廣泛用作鍵值緩存的原因是緩存工作負(fù)載會(huì)很快耗盡閃存驅(qū)動(dòng)器。這些工作負(fù)載通常由小對(duì)象組成，其中一些對(duì)象需要經(jīng)常更新[10,31]。但是，ssd內(nèi)的現(xiàn)代閃存芯片在其生命周期中只能在每個(gè)位置寫入幾千次。

? ??????????此外，ssd還受到寫放大(WA)的影響。也就是說(shuō)，對(duì)于應(yīng)用程序所寫的每個(gè)字節(jié)(例如鍵值緩存)，在設(shè)備級(jí)別上還要向flash寫入幾個(gè)字節(jié)。WA的發(fā)生是因?yàn)閒lash頁(yè)面被物理地分組在大塊中。在覆蓋頁(yè)面之前，必須先刪除它們，但這只能在塊的粒度中完成。結(jié)果是，隨著時(shí)間的推移，這些大塊通常包含有效頁(yè)面和無(wú)效頁(yè)面的混合。在刪除一個(gè)塊之前，必須將任何有效的頁(yè)面復(fù)制到其他flash塊。這個(gè)垃圾收集過(guò)程創(chuàng)建了設(shè)備級(jí)寫放大(DLWA)，它可以將寫入flash的數(shù)據(jù)量增加幾個(gè)數(shù)量級(jí)?，F(xiàn)代ssd通過(guò)將許多flash塊分割在一起(512 MB或更多)來(lái)提高順序?qū)懶阅?x2.1，[38])，從而加劇了這種情況。

? ??????為了最小化閃存寫入的數(shù)量，SSD存儲(chǔ)系統(tǒng)被限制為以大的連續(xù)塊寫入數(shù)據(jù)。這就強(qiáng)制了一種二階寫放大，這是緩存特有的，我們稱之為緩存級(jí)寫放大(CLWA)。當(dāng)緩存被迫重新定位對(duì)象以避免DLWA時(shí)，就會(huì)發(fā)生CLWA。例如，當(dāng)一個(gè)熱對(duì)象占用了與許多準(zhǔn)備清除的項(xiàng)相同的flash塊時(shí)，緩存將面臨一個(gè)選擇。它可以用冷對(duì)象驅(qū)逐熱對(duì)象，也可以將熱對(duì)象重寫為新的大型寫入的一部分。因此，在現(xiàn)有的SSD緩存設(shè)計(jì)中，對(duì)象被多次重寫到flash中。

? ??????為了解決這個(gè)問(wèn)題，最新的RIPQ[38]系統(tǒng)建議，在flash中，通過(guò)將熱對(duì)象和冷對(duì)象插入到不同的物理區(qū)域來(lái)存儲(chǔ)它們。然而，flash上有效的數(shù)據(jù)放置并不足以對(duì)抗高CLWA，事實(shí)上，在某些情況下可能會(huì)進(jìn)一步增加CLWA。例如，考慮一個(gè)應(yīng)用程序，其中大量對(duì)象不常被訪問(wèn)(或頻繁更新)。因?yàn)镽IPQ將所有對(duì)象(熱對(duì)象和冷對(duì)象)都包含在flash中，所以不經(jīng)常訪問(wèn)的對(duì)象將被插入到“冷”插入點(diǎn)中，并且在再次訪問(wèn)之前，類型很容易被刪除。因此，可以多次插入和刪除這些對(duì)象。我們展示了在這樣的工作負(fù)載下，RIPQ的CLWA高達(dá)150 (x5)，這意味著對(duì)于許多應(yīng)用程序來(lái)說(shuō)，它將很快耗盡flash設(shè)備。

? ??????隨著時(shí)間的推移，閃速可靠性問(wèn)題將變得更加嚴(yán)重，因?yàn)殡S著閃速密度的增加，其耐久性將繼續(xù)降低[20]。特別是，下一代flash技術(shù)(QLC)可以比現(xiàn)有技術(shù)(TLC)少忍受30次寫入[3,29,32]。

? ??????我們提出了一種新的混合鍵值緩存Flashield，它同時(shí)使用DRAM和ssd。我們的貢獻(xiàn)是一種新的緩存策略，它顯著延長(zhǎng)了ssd的生命周期，通過(guò)控制和最小化對(duì)flash的寫操作數(shù)量，它可以與DRAM相媲美。我們的主要觀察是，并非所有進(jìn)入緩存的對(duì)象都適合放置在SSD中。特別是，緩存應(yīng)該避免將對(duì)象寫入flash，這些對(duì)象將在不久的將來(lái)被更新或不會(huì)被讀取。然而，當(dāng)對(duì)象第一次進(jìn)入緩存時(shí)，它不知道哪些對(duì)象適合SSD，哪些不適合。

? ??????因此，F(xiàn)lashield設(shè)計(jì)的一個(gè)關(guān)鍵思想是，插入到緩存中的對(duì)象總是要在DRAM中花費(fèi)一段時(shí)間，在此期間，緩存知道它們是否適合閃存。如果他們真的證明自己是值得閃光的，F(xiàn)lashield會(huì)把他們變成閃光。如果沒(méi)有，它們將永遠(yuǎn)不會(huì)移動(dòng)到flash中，這將減少結(jié)果寫入放大。由于flash層比DRAM大得多(例如，比DRAM大10個(gè))，移動(dòng)到flash中的對(duì)象在緩存中的平均停留時(shí)間要比那些留在DRAM中的對(duì)象長(zhǎng)得多。

? ??????為了動(dòng)態(tài)地確定哪些對(duì)象是適合在變化工作負(fù)載下使用flash的對(duì)象，我們使用基于機(jī)器學(xué)習(xí)的支持向量機(jī)(SVM)分類實(shí)現(xiàn)了允許控制算法。我們?yōu)榫彺嬷械拿總€(gè)應(yīng)用程序訓(xùn)練一個(gè)不同的分類器。為了訓(xùn)練分類器，我們?cè)O(shè)計(jì)了一種輕量級(jí)的采樣技術(shù)，它可以隨著時(shí)間的推移對(duì)對(duì)象進(jìn)行一致采樣，收集關(guān)于過(guò)去讀取和更新次數(shù)的統(tǒng)計(jì)信息。分類器預(yù)測(cè)一個(gè)對(duì)象在未來(lái)是否會(huì)被讀取n次以上而不被更新，用來(lái)確定它是否適合存儲(chǔ)在flash上。我們稱這種度量為閃光。

? ??????Flashield設(shè)計(jì)的第二個(gè)主要思想是，它為存儲(chǔ)在flash上的可變長(zhǎng)度對(duì)象提供了新穎的基于戲劇的查找索引，每個(gè)對(duì)象只需要不到4字節(jié)的DRAM。這比RIPQ小5個(gè)多，后者每個(gè)對(duì)象包含22個(gè)字節(jié)。由于flash層比DRAM的容量要大得多,一個(gè)na¨?ve查找索引的對(duì)象存儲(chǔ)在閃存將消耗整個(gè)DRAM的能力。由于沒(méi)有存儲(chǔ)對(duì)象的位置及其對(duì)應(yīng)的鍵，我們的索引消耗的內(nèi)存相對(duì)較少。相反,為每一個(gè)對(duì)象存儲(chǔ)在閃存上,該指數(shù)包含一個(gè)指針指向一個(gè)地區(qū)的flash對(duì)象存儲(chǔ),它存儲(chǔ)一個(gè)額外的4位指定對(duì)象上的一個(gè)哈希函數(shù)關(guān)鍵指示對(duì)象的插入點(diǎn)在其地區(qū)閃光。索引利用bloom過(guò)濾器來(lái)指示對(duì)象是否駐留在flash上，而不需要在DRAM中存儲(chǔ)完整的鍵。平均而言，F(xiàn)lashield的查找索引只需要從SSD讀取1.03個(gè)數(shù)據(jù)就可以返回存儲(chǔ)在其中的對(duì)象。

? ??????我們?cè)贑語(yǔ)言中實(shí)現(xiàn)Flashield，并在一組使用memcachier[7](一種流行的基于云的緩存服務(wù))的實(shí)際應(yīng)用程序上評(píng)估它的性能。我們表明，與RIPQ[38]相比，F(xiàn)lashield在保持相同的平均命中率的同時(shí)，將寫入放大中值降低了5，平均降低了16，索引大小降低了5以上。我們表明，當(dāng)對(duì)象從SSD讀取時(shí)，F(xiàn)lashield的讀取延遲和吞吐量接近SSD的延遲和吞吐量，當(dāng)對(duì)象寫到緩存或從DRAM讀取時(shí)，它的延遲和吞吐量類似于基于戲劇的緩存，比如Memcached。

? ??????本文的主要貢獻(xiàn)有三:

1. Flashield是第一個(gè)明確使用DRAM作為允許控制過(guò)濾器來(lái)決定將哪些對(duì)象插入flash的SSD存儲(chǔ)系統(tǒng)。

2. Flashield的新穎閃存內(nèi)存查找索引在DRAM中每個(gè)對(duì)象占用不到4個(gè)字節(jié)，同時(shí)又不犧牲閃存的寫入和讀取功能。

3.Flashield是第一個(gè)使用基于機(jī)器學(xué)習(xí)的承認(rèn)控制算法和輕量級(jí)時(shí)間采樣來(lái)預(yù)測(cè)哪些對(duì)象將是flash的良好候選對(duì)象的鍵值緩存。

由于新一代flash技術(shù)可以容忍更少的寫操作[3,20,29,32]，我們對(duì)flash的動(dòng)態(tài)允許控制可以擴(kuò)展到緩存之外的其他系統(tǒng)，比如flash數(shù)據(jù)庫(kù)和文件系統(tǒng)。

表一：組合容量為4.25 TB的混合緩存服務(wù)器的成本，與具有相同聚合容量的多個(gè)僅供dramonly緩存服務(wù)器的成本相比。SSD每比特的優(yōu)勢(shì)成本使得混合緩存服務(wù)器的總擁有成本降低了10。

圖1:使用不同的寫入大小連續(xù)寫入4 TB后的設(shè)備級(jí)寫入放大。

問(wèn)題：

????????設(shè)計(jì)基于ssd的高速緩存需要解決兩個(gè)控制問(wèn)題。ssd的性能很差，并且很快就會(huì)耗盡，除非寫操作很大而且是連續(xù)的。這與緩存工作負(fù)載的特性有關(guān)。緩存存儲(chǔ)具有高度可變生存期的小對(duì)象;這使得緩存更傾向于使用小的隨機(jī)I/O進(jìn)行寫操作，這將很快耗盡閃存驅(qū)動(dòng)器。

????????SSD的生命周期由閃存設(shè)備制造商定義為，在設(shè)備產(chǎn)生不可糾正的讀取錯(cuò)誤(例如，遇到損壞位的概率為10 - 15)之前的時(shí)間量。SSD的生命周期取決于幾個(gè)因素，包括寫和擦除的數(shù)量(稱為程序擦除周期)、SSD單元刷新周期之間的平均時(shí)間、單元技術(shù)、錯(cuò)誤糾正代碼等等。閃存電池的典型壽命是3-5年，平均每天寫3-5次。

????????器件磨損的關(guān)鍵指標(biāo)是寫入放大。許多寫模式迫使SSD對(duì)flash執(zhí)行額外的寫操作，以便重新組織數(shù)據(jù)。寫入放大是指寫入閃存芯片的字節(jié)數(shù)與應(yīng)用程序發(fā)送到SSD的字節(jié)數(shù)之比。寫入放大為1表示應(yīng)用程序?qū)懭氲拿總€(gè)字節(jié)導(dǎo)致一個(gè)字節(jié)寫入到flash。寫入放大10表示應(yīng)用程序?qū)懭氲拿總€(gè)字節(jié)會(huì)導(dǎo)致額外的9字節(jié)數(shù)據(jù)被重新組織并寫入flash。

設(shè)備級(jí)的寫放大：

?????????設(shè)備級(jí)寫放大(DLWA)是由SSD內(nèi)部重組引起的寫放大。DLWA的主要來(lái)源是flash重用單元的大小。Flash是讀和寫在小(?8 KB)頁(yè)面。然而，如果不先擦除，就不能重寫頁(yè)面。擦除發(fā)生在幾頁(yè)稱為組塊的粒度(?256 KB)。當(dāng)設(shè)備處于高利用率時(shí)，頁(yè)面大小(或?qū)ο蟠笮?與擦除單元大小之間的不匹配會(huì)導(dǎo)致寫入放大。

????????例如，當(dāng)應(yīng)用程序覆蓋頁(yè)面的內(nèi)容時(shí)，SSD將其寫入一個(gè)不同的新塊，并維護(hù)一個(gè)名為Flash Translation Layer (FTL)的重新定位映射。原始?jí)K還不能被刪除，因?yàn)橥粔K中的其他頁(yè)可能仍然是活動(dòng)的。當(dāng)閃存芯片完全被占用時(shí)，SSD必須刪除塊，以便為新寫的頁(yè)面騰出空間。如果沒(méi)有一個(gè)塊中所有的頁(yè)面都被最近編寫的數(shù)據(jù)所遍歷，那么來(lái)自多個(gè)塊的活動(dòng)頁(yè)面必須合并到一個(gè)flash塊中。

????????這種整合或垃圾收集是DLWA的來(lái)源。如果一個(gè)設(shè)備的占用率達(dá)到90%，它的DLWA可能會(huì)非常高。圖1顯示了順序?qū)懭牒蛂andom寫入下的DLWA。測(cè)量是在一臺(tái)480 GB的英特爾535系列SSD上進(jìn)行的，使用的是一種用于監(jiān)控設(shè)備內(nèi)部結(jié)構(gòu)的智能系統(tǒng)。對(duì)于每個(gè)數(shù)據(jù)點(diǎn)，隨機(jī)生成的4tb數(shù)據(jù)被隨機(jī)或順序地寫入具有不同緩沖區(qū)大小的設(shè)備的原始邏輯塊地址。具體來(lái)說(shuō)，在隨機(jī)工作負(fù)載中，邏輯塊空間被劃分為相鄰的固定緩沖區(qū)大小的區(qū)域;每次寫操作都會(huì)隨機(jī)地用隨機(jī)數(shù)據(jù)的完整緩沖區(qū)覆蓋其中一個(gè)區(qū)域。順序工作負(fù)載是循環(huán)的;區(qū)域在其邏輯塊地址的順序中被覆蓋，根據(jù)需要循環(huán)回到設(shè)備的開(kāi)始。對(duì)于這兩種模式，我們通過(guò)將寫限制在邏輯塊地址的較小部分來(lái)改變?cè)O(shè)備空間的利用率。

? ??????結(jié)果表明，隨機(jī)排列的1mb閃存寫入體驗(yàn)接近8個(gè)DLWA。這是令人驚訝的，因?yàn)殚W存擦除塊小于1 MB。這種寫放大的原因是因?yàn)閟sd越來(lái)越優(yōu)化高寫帶寬。SSD內(nèi)的每個(gè)閃存包都是通過(guò)一個(gè)相對(duì)較慢的鏈接訪問(wèn)的(目前為50- 90mb /s);ssd在多個(gè)flash包中并行條帶大順序?qū)?，以獲得高的寫帶寬。這有效地將多個(gè)包中的擦除塊融合到一個(gè)邏輯擦除塊中。一個(gè)1mb的隨機(jī)寫標(biāo)記了一個(gè)大區(qū)域的頁(yè)面已經(jīng)準(zhǔn)備好被擦除，但是這個(gè)區(qū)域是跨幾個(gè)仍然包含大部分活動(dòng)頁(yè)面的擦除單元分段的。其他人也證實(shí)了這一效應(yīng)。

????????有兩種方法可以對(duì)抗這種影響。第一個(gè)是用bw的單位寫其中B是擦除塊的大小w是SSD條帶寫過(guò)的塊數(shù)。我們的結(jié)果表明，為了消除DLWA，緩存必須以512 MB的塊寫入。第二種方法是按順序編寫設(shè)備，始終按fifo順序編寫。這是可行的，因?yàn)槊總€(gè)寫的bw產(chǎn)生一個(gè)完全空的bw單元，即使寫的單元小于bw。圖1顯示了8mb的順序?qū)懭胍蚕薉LWA。

????????這意味著我們的緩存在如何向flash寫入數(shù)據(jù)方面受到了極大的限制。為了最小化DLWA，緩存必須以大塊或順序?qū)懭雽?duì)象。在這兩種情況下，緩存幾乎無(wú)法精確控制應(yīng)該在flash上替換哪些對(duì)象。

緩存級(jí)寫入放大：

????????在大段(連續(xù)的數(shù)據(jù)塊)中寫入閃存是對(duì)總體寫入放大進(jìn)行微型化的必要條件，但不是充分條件。大分段寫入的主要副作用是緩存級(jí)寫入放大(CLWA)。當(dāng)從SSD中刪除的對(duì)象被緩存清除策略重寫到它時(shí)，就會(huì)發(fā)生CLWA。如果段的大小(MBs)明顯大于對(duì)象的大小(字節(jié)或KBs)，則很難保證緩存中的高級(jí)對(duì)象總是與低級(jí)別對(duì)象或包含舊值的對(duì)象在物理上分開(kāi)存儲(chǔ)。因此，當(dāng)從緩存中刪除具有許多低級(jí)別對(duì)象的段時(shí)，它也可能無(wú)意中刪除一些高級(jí)別對(duì)象。

????????表2給出了Memcachier(一個(gè)商業(yè)Memcached服務(wù)提供者)長(zhǎng)達(dá)一周的跟蹤的一般統(tǒng)計(jì)數(shù)據(jù)[13,14]，圖2給出了在跟蹤中編寫的對(duì)象大小的分布。圖中顯示對(duì)象大小差異很大，而且通常非常小:寫入緩存的對(duì)象的平均大小為257字節(jié)，80.67%的對(duì)象小于1 KB。因此，即使使用順序?qū)懭氲亩未笮?mb(這是不會(huì)導(dǎo)致額外寫入放大的最小段大小)，每個(gè)段平均也將包含32,000多個(gè)惟一對(duì)象。

????????此外，60.6%的寫操作(和5.8%的所有請(qǐng)求)是未讀的寫操作，這意味著它們?cè)诒粚懼笥肋h(yuǎn)不會(huì)被讀，0.5%的請(qǐng)求是更新。未讀寫和更新都有助于寫放大。理想情況下，未讀的寫不應(yīng)該寫入緩存。在更新的情況下，為了在對(duì)象更新之后回收該對(duì)象的空間，緩存需要擦除并重寫該對(duì)象。

????????RIPQ[38]代表了將CLWA最小化的最新技術(shù);它是一個(gè)基于ssd的照片緩存，通過(guò)插入在過(guò)去一起讀取k次的對(duì)象來(lái)最小化CLWA。當(dāng)對(duì)象第一次插入緩存時(shí)，它們被緩沖在內(nèi)存中，并定期與其他讀取相同次數(shù)的對(duì)象一起作為段移動(dòng)到flash中。這個(gè)想法是，在過(guò)去被讀取k次的對(duì)象可能在未來(lái)具有類似的清除級(jí)別。例如，一個(gè)讀取過(guò)一次的對(duì)象與其他讀取過(guò)一次的對(duì)象存儲(chǔ)在同一段flash中。包含讀取次數(shù)較少的對(duì)象的段將比讀取次數(shù)較多的對(duì)象的段更快地被清除。

????????RIPQ適用于較大且不可變的照片，但它在web緩存工作負(fù)載中會(huì)失效，因?yàn)樵趙eb緩存工作負(fù)載中，值較小且更新更頻繁。為了說(shuō)明這一點(diǎn)，我們使用Memcachier跟蹤模擬了RIPQ的CLWA (RIPQ實(shí)現(xiàn)是不可公開(kāi)使用的)，使用一個(gè)帶有8個(gè)隊(duì)列的分段LRU。我們還用受害者緩存策略相比,SSD的nat?ve方法只是作為L(zhǎng)2高速緩存(即。，從DRAM中移除的每個(gè)對(duì)象都寫入SSD)。Facebook的圖形數(shù)據(jù)存儲(chǔ)TAO[11]使用了這種策略，它利用有限的flash作為存儲(chǔ)在DRAM中的數(shù)據(jù)的受害者緩存。仿真為跟蹤中的每個(gè)應(yīng)用程序分配相同的內(nèi)存，DRAM與SSD的比例為1:7。

? ??????結(jié)果如表3所示，雖然RIPQ對(duì)受害者緩存有了很大的改進(jìn)，但它仍然從一個(gè)非常高的CLWA開(kāi)始使用。請(qǐng)注意，受害者緩存將受到更大的總WA的影響，因?yàn)樗€受到DLWA的影響(因?yàn)樗鼪](méi)有在大的段中寫入flash)。RIPQ患有CLWA有兩個(gè)原因。首先，RIPQ沒(méi)有允許策略，它將所有傳入的對(duì)象都寫入flash;甚至是未讀的對(duì)象或快速更新的對(duì)象。其次，當(dāng)某個(gè)對(duì)象的讀取頻率發(fā)生變化時(shí)，它會(huì)創(chuàng)建額外的寫操作。例如，如果一個(gè)對(duì)象在寫完之后的一段時(shí)間內(nèi)被讀了兩次，那么它將與在flash上讀了兩次的其他對(duì)象分組。但是，如果它被讀了5次以上，那么RIPQ需要重寫它，將它與其他級(jí)別更高的對(duì)象分組。由于對(duì)象比段大小小得多，而且跟蹤中寫入的比例相對(duì)較高，所以RIPQ很難保證在同一時(shí)間讀取的對(duì)象存儲(chǔ)在同一段中。

????????這些結(jié)果提供了兩條線索，說(shuō)明緩存應(yīng)該如何以不同的方式利用DRAM來(lái)最小化web緩存工作負(fù)載的CLWA。首先，并不是應(yīng)用程序插入緩存的每個(gè)對(duì)象都適合存儲(chǔ)在SSD上。例如，對(duì)象在第一次寫入后不久就會(huì)更新，或者對(duì)象在將來(lái)被讀取的可能性很低。然而，這些對(duì)象的出現(xiàn)在不同的應(yīng)用程序中有很大的差異。例如，在Memcachier跟蹤的一些應(yīng)用程序中，超過(guò)一半的已寫對(duì)象將不再讀取，而在一些應(yīng)用程序中，絕大多數(shù)對(duì)象將被多次讀取，并且應(yīng)該寫入緩存。其次，由于段大小和對(duì)象大小之間的差異，很難保證被驅(qū)逐策略排序相似的對(duì)象將存儲(chǔ)在SSD上物理上相鄰的區(qū)域。

????????這兩種觀點(diǎn)都激發(fā)了Flashield，一個(gè)成功地在沒(méi)有DWLA的情況下最小化CLWA的緩存。

設(shè)計(jì)：

????????Flashield的設(shè)計(jì)目標(biāo)是最小化緩存級(jí)和設(shè)備級(jí)的寫放大，同時(shí)保持正常的命中率。Flashield設(shè)計(jì)的關(guān)鍵觀點(diǎn)是使用DRAM作為過(guò)濾器，它可以防止將對(duì)象移動(dòng)到flash中，而flash很快就會(huì)被刪除或更新，并保持高效的內(nèi)存索引，從而保持低的寫和讀放大。

????????圖3說(shuō)明了Flashield中對(duì)象的生存期。對(duì)象總是首先寫入DRAM。第一次讀取對(duì)象之后，F(xiàn)lashield開(kāi)始收集描述其性能的特性。這些包含關(guān)于對(duì)象何時(shí)以及多少次被讀取和更新的信息。對(duì)象可以通過(guò)Flashield的清除算法從DRAM中清除。

????????Flashield會(huì)周期性地將一個(gè)由許多DRAM對(duì)象組成的段(如512 MB)移動(dòng)到flash中。Flashield使用機(jī)器學(xué)習(xí)分類器根據(jù)對(duì)象的特征對(duì)其進(jìn)行排序。如果一個(gè)對(duì)象通過(guò)了一個(gè)等級(jí)閾值，它將被認(rèn)為是移動(dòng)到flash的候選對(duì)象。然后根據(jù)他們的分?jǐn)?shù)對(duì)flash的候選人進(jìn)行排名，這決定了他們被Flashield移動(dòng)到flash中的順序。這一順序非常重要，當(dāng)有更多的華而不實(shí)的候選人，超過(guò)可以容納在一個(gè)單一的部分。當(dāng)對(duì)象被移動(dòng)到flash后，它將在緩存中駐留相對(duì)較長(zhǎng)的時(shí)間。一旦它的段按FIFO順序從flash中刪除，它就會(huì)被移出flash。此時(shí)，如果對(duì)象的回收優(yōu)先級(jí)較低，那么它將被回收;如果對(duì)象的回收優(yōu)先級(jí)較高，那么它將被重新插入DRAM。一旦對(duì)象被重新插入到DRAM中，它必須再次證明自己具有flash的價(jià)值，然后再將其重寫到flash中。有關(guān)詳細(xì)信息，請(qǐng)參見(jiàn)x4.3。

????????在Flashield中，DRAM有三個(gè)用途。首先，它被用作一個(gè)過(guò)濾器來(lái)決定應(yīng)該將哪些對(duì)象插入SSD。其次，它存儲(chǔ)用于在flash上查找和刪除對(duì)象的元數(shù)據(jù)。第三，在對(duì)象轉(zhuǎn)移到SSD之前，它充當(dāng)對(duì)象的緩存層，并為不適合SSD的對(duì)象提供緩存層。

? DRAM作為過(guò)濾器：

????????在Flashield中，DRAM是將物體移動(dòng)到flash中的試驗(yàn)場(chǎng)。當(dāng)對(duì)象首次被寫入DRAM時(shí)，F(xiàn)lashield并不知道它們是否適合flash。此外，應(yīng)用程序具有獨(dú)特的工作負(fù)載，因此需要單獨(dú)學(xué)習(xí)它們的訪問(wèn)模式。

????????判斷哪些對(duì)象值得閃速的稻草人方法是根據(jù)簡(jiǎn)單的指標(biāo)(如頻率或頻率)對(duì)它們進(jìn)行排序，就像標(biāo)準(zhǔn)的緩存替換策略(如LRU或LFU)所做的那樣。然而，很難為flash設(shè)置一個(gè)適用于所有應(yīng)用程序的正弦閾值。例如，系統(tǒng)可以定義一個(gè)基于頻率的閾值，要求對(duì)象在進(jìn)入flash之前被讀取多次。然而，對(duì)于某些應(yīng)用程序，這種閾值被證明過(guò)于嚴(yán)格，因?yàn)樵L問(wèn)模式很長(zhǎng)，并且由于過(guò)早的清除而降低了命中率。對(duì)于其他應(yīng)用程序，它也可能過(guò)于寬松，因?yàn)樵谶@些應(yīng)用程序中，對(duì)象將被不必要地寫入flash。即使對(duì)于單個(gè)應(yīng)用程序，這樣的閾值也是一種啟發(fā)式，必須手動(dòng)調(diào)優(yōu)(參見(jiàn)下面描述的示例和表4中描述的示例)。

????????機(jī)器學(xué)習(xí)不是使用一種放之四海而皆準(zhǔn)的方法，而是可以作為一種動(dòng)態(tài)學(xué)習(xí)方法，來(lái)了解哪些對(duì)象適合每個(gè)應(yīng)用程序的flash。

Flashiness：

????????我們將flashiness定義為一個(gè)指標(biāo)，它可以預(yù)測(cè)一個(gè)對(duì)象是否適合flash。flashiness得分高的對(duì)象是滿足兩個(gè)條件的對(duì)象。首先，它是一個(gè)在不久的將來(lái)將被訪問(wèn)n次的對(duì)象(其中n是一個(gè)可配置參數(shù))。這保證了它不會(huì)被緩存的清除函數(shù)清除。其次，它需要在不久的將來(lái)是不可變的，因?yàn)楦耂SD中的對(duì)象需要額外的寫操作

????????系統(tǒng)可以使用閾值n(一個(gè)對(duì)象在未來(lái)被讀取的次數(shù))來(lái)表示寫放大的敏感度。如果系統(tǒng)對(duì)寫入放大非常敏感，它可以將n設(shè)置為一個(gè)相對(duì)較高的數(shù)字，這將確保Flashield只會(huì)將其預(yù)測(cè)將在未來(lái)多次讀取的對(duì)象移動(dòng)到flash中。另一方面，如果系統(tǒng)對(duì)命中率更敏感，則將n設(shè)置為一個(gè)較低的數(shù)字。此外，F(xiàn)lashield允許操作員對(duì)flash寫速率設(shè)置一個(gè)固定的限制，以保持一定的目標(biāo)生存期。

????????通過(guò)預(yù)測(cè)一個(gè)對(duì)象在不久的將來(lái)將被讀取的次數(shù)(例如，一個(gè)小時(shí))，以及省略預(yù)測(cè)在這個(gè)preiod期間將被更新的對(duì)象，可以捕獲上述兩個(gè)flash標(biāo)準(zhǔn)。Flashield通過(guò)收集兩個(gè)特征(1)過(guò)去的讀取次數(shù)和(2)過(guò)去的更新次數(shù)，使用支持向量機(jī)(SVM)的二元分類器來(lái)預(yù)測(cè)閃度。圖4提供了與Memcachier跟蹤不同應(yīng)用程序的分類器的準(zhǔn)確性，其值為變量n。準(zhǔn)確度定義為，其中tp為真陽(yáng)性，tn為真陰性，fp為假陽(yáng)性，fn為假陰性。分類器使用一個(gè)小時(shí)的訓(xùn)練時(shí)間來(lái)預(yù)測(cè)一個(gè)對(duì)象在未來(lái)是否會(huì)被至少n次訪問(wèn)而不被更新。

? ??????由于不同的應(yīng)用程序的工作負(fù)載不同，預(yù)測(cè)的準(zhǔn)確性也不同(從75%到99%)。此外，隨著n個(gè)折痕的增加，精度通常會(huì)降低。這是因?yàn)殡S著n的增加，分類器試圖預(yù)測(cè)更罕見(jiàn)的事件，其中觀察到的訓(xùn)練數(shù)據(jù)點(diǎn)更少。例如，在接下來(lái)的一個(gè)小時(shí)內(nèi)，被閱讀超過(guò)一次的對(duì)象比被閱讀超過(guò)五次的對(duì)象要多。

????????要演示為什么機(jī)器學(xué)習(xí)比使用固定的閾值來(lái)確定flash的過(guò)去訪問(wèn)次數(shù)更有效，請(qǐng)考慮下面的示例。我們?cè)诟櫟膽?yīng)用程序之間訓(xùn)練了一個(gè)簡(jiǎn)單的分類器，該分類器使用深度為1的決策樹，利用單個(gè)特性(過(guò)去讀取的次數(shù))，嘗試用n = 5預(yù)測(cè)閃度。表4給出了決策樹根據(jù)其訓(xùn)練樣本為每個(gè)應(yīng)用程序選擇的閾值，該閾值將提供最高的預(yù)測(cè)精度。結(jié)果表明，沒(méi)有一個(gè)單一的靜態(tài)閾值對(duì)所有應(yīng)用程序都是最優(yōu)的。這也表明很難預(yù)先確定這個(gè)閾值是多少。例如，對(duì)于應(yīng)用程序d，過(guò)去僅發(fā)生兩次讀取就足以預(yù)測(cè)將來(lái)它將被讀取5次或更多。

? ??Flashiness設(shè)計(jì)的討論：

? ??????我們嘗試了幾個(gè)與讀取和更新的數(shù)量和頻率相關(guān)的不同特性。我們發(fā)現(xiàn)，在預(yù)測(cè)和捕獲讀取和更新的過(guò)去信息時(shí)，唯一有效的特性是:(1)讀取的過(guò)去次數(shù)和(2)更新的過(guò)去次數(shù)。

????????令我們驚訝的是，我們發(fā)現(xiàn)，在我們測(cè)量的所有應(yīng)用程序中，與最近時(shí)間相關(guān)的特性(例如，兩次讀取之間的時(shí)間，上次讀取之后的時(shí)間)對(duì)預(yù)測(cè)沒(méi)有正面影響，而且事實(shí)上，在某些情況下，分類器的準(zhǔn)確性降低了。這支持我們的設(shè)計(jì)選擇，將flashiness度量(基于過(guò)去訪問(wèn)的數(shù)量和類型)與驅(qū)逐令策略(通常基于最近)解耦(例如，LRU或其衍生物之一，請(qǐng)參見(jiàn)x3.4)。

????????此外，我們還嘗試了幾種不同的分類算法。最初，我們嘗試使用邏輯回歸直接預(yù)測(cè)這個(gè)數(shù)字。我們?cè)贛emcachier trace上運(yùn)行了這個(gè)分類器，發(fā)現(xiàn)預(yù)測(cè)非常不準(zhǔn)確。嘗試不同的特性和分類后,我們發(fā)現(xiàn)很難準(zhǔn)確預(yù)測(cè)到底多少次訪問(wèn)一個(gè)對(duì)象將在未來(lái),這就是為什么我們使用二進(jìn)制分類、預(yù)測(cè)未來(lái)的讀取次數(shù)是否超過(guò)n。我們也試著用一個(gè)不同的二元分類器,決策樹,它提供了非常相似的支持向量機(jī)的精度。我們決定使用SVM，因?yàn)樗峁┝艘粋€(gè)連續(xù)的分?jǐn)?shù)，用來(lái)為對(duì)象提供一個(gè)全局的Flashiness等級(jí)。對(duì)于決策樹，分?jǐn)?shù)的范圍僅限于葉子的數(shù)量。

?DRAM作為Flash的索引：

????????與日志結(jié)構(gòu)的合并樹(LSM)不同，F(xiàn)lashield將索引存儲(chǔ)在DRAM中(對(duì)于DRAM中的對(duì)象和flash中的對(duì)象)。這允許Flashield以更低的延遲服務(wù)請(qǐng)求，因?yàn)樗饕菑腄RAM讀取的。更重要的是，將索引存儲(chǔ)在flash上需要LSMs在對(duì)象更新時(shí)不斷更新索引，這將創(chuàng)建大量的寫操作[24,27,39]。當(dāng)索引在DRAM上時(shí)，更新它很簡(jiǎn)單。然而，由于Flashield也使用DRAM作為一個(gè)允許控制層，我們必須確保索引將在DRAM上占用最少的空間。

????????與Memcached類似，F(xiàn)lashield將索引存儲(chǔ)在散列表中，以啟用有效的查找。本機(jī)索引將包含存儲(chǔ)在flash中的鍵的標(biāo)識(shí)、值的位置以及它們?cè)谇宄?duì)列中的位置。然而，這樣一個(gè)指數(shù)的成本將高得令人望而卻步。如果我們把一個(gè)6結(jié)核病閃存設(shè)備平均對(duì)象大小257字節(jié)(等于平均對(duì)象大小Memcachier跟蹤前20名的應(yīng)用程序),為每一個(gè)對(duì)象存儲(chǔ)一個(gè)散列的關(guān)鍵,避免碰撞至少需要8個(gè)字節(jié),每個(gè)對(duì)象存儲(chǔ)的確切位置是43位,并保持一個(gè)指向隊(duì)列中的位置將4 - 8個(gè)字節(jié)。在DRAM上為每個(gè)對(duì)象存儲(chǔ)17個(gè)字節(jié)將需要406gb的DRAM。這將占用(或超過(guò))高端服務(wù)器的所有DRAM。例如，在RIPQ中，每個(gè)內(nèi)存索引條目都是22字節(jié)。我們?yōu)榭勺兇笮〉膶?duì)象設(shè)計(jì)了一種新的內(nèi)存查找索引，每個(gè)對(duì)象使用不到4個(gè)字節(jié)，不會(huì)引起額外的閃存寫入放大。

????????身份的鑰匙。Flashield沒(méi)有在索引中存儲(chǔ)鍵的標(biāo)識(shí)，而是將它們作為對(duì)象元數(shù)據(jù)的一部分保存在flash設(shè)備中。為了在查找哈希表中識(shí)別哈希沖突，F(xiàn)lashield比較了flash中的鍵。為了限制鍵查找期間的flash讀取次數(shù)并避免復(fù)雜的表擴(kuò)展，F(xiàn)lashield使用了一個(gè)沒(méi)有鏈的多選擇哈希表。在查找過(guò)程中，將逐個(gè)使用預(yù)定義的散列函數(shù)，這樣，如果沒(méi)有找到鍵，就使用下一個(gè)散列函數(shù)。使用所有散列函數(shù)，但仍未找到密鑰，F(xiàn)lashield返回一個(gè)誤操作。類似地，如果在插入期間發(fā)生沖突，則使用下一個(gè)散列函數(shù)重新散列密鑰，以將其映射到查找表中的另一個(gè)條目。如果使用了所有散列函數(shù)，并且仍然存在沖突，則將刪除最后一個(gè)沖突對(duì)象，以便為新鍵騰出空間。

? ??????為了減少在出現(xiàn)哈希沖突時(shí)從flash中讀取的多余數(shù)據(jù)，F(xiàn)lashield為每個(gè)段使用內(nèi)存中的bloom過(guò)濾器，該過(guò)濾器指示鍵是否存儲(chǔ)在該段中。我們決定為每個(gè)段使用一個(gè)bloom過(guò)濾器，而不是全局bloom過(guò)濾器，以消除bloom過(guò)濾器支持刪除的需要(因?yàn)槊總€(gè)段都是不可變的)。我們使用bloom過(guò)濾器，假陽(yáng)性率為1%。對(duì)于Memcachier跟蹤，這將轉(zhuǎn)換為平均每點(diǎn)擊一次flash，就有1.03次對(duì)flash的訪問(wèn)，每個(gè)條目的額外內(nèi)存開(kāi)銷為10位。

????????對(duì)象的位置。索引不直接存儲(chǔ)SSD對(duì)象的位置，而是包含兩個(gè)單獨(dú)的字段:段號(hào)和預(yù)定義散列函數(shù)的ID。段號(hào)表示flash中存儲(chǔ)對(duì)象的連續(xù)段。使用預(yù)定義的散列函數(shù)散列對(duì)象的鍵可以提供對(duì)象在段中的偏移量。使用哈希函數(shù)來(lái)指示段中的對(duì)象位置可能會(huì)降低閃存的利用率，因?yàn)樗拗屏嗽诙沃蟹胖脤?duì)象的可能位置的數(shù)量。注意，這些哈希函數(shù)與用于哈希表查找的哈希函數(shù)是正交的。我們選擇使用16個(gè)預(yù)定義的哈希函數(shù)(即。由于增加了哈希函數(shù)的數(shù)量，使得flash的使用性能得到了顯著的改善。我們將在x5.3中探討flash的使用。注意，由于數(shù)據(jù)是按順序?qū)懭雈lash的，因此8 MB或更大的段大小可以實(shí)現(xiàn)最小的DLWA。為了減少索引開(kāi)銷，我們使用512 MB的段。

????????拆遷政策。為了避免維護(hù)由雙鏈點(diǎn)列表組成的完整回收隊(duì)列的開(kāi)銷，F(xiàn)lashield使用時(shí)鐘算法[16]，類似于其他內(nèi)存鍵值緩存[18]。CLOCK近似于LRU策略，因此為了評(píng)估它的影響，我們?cè)谀M中運(yùn)行了Memcachier跟蹤中的前5個(gè)應(yīng)用程序，并比較了CLOCK和LRU之間的結(jié)果。結(jié)果表明，對(duì)于時(shí)鐘時(shí)間戳，每個(gè)對(duì)象只保留2位，與LRU相比，平均命中率僅下降0.1%。

????????圖5總結(jié)了Flashield的查找過(guò)程。首先對(duì)查找鍵進(jìn)行散列，以在lookup散列表中找到對(duì)應(yīng)的條目ID，該散列表提供了段ID。然后，F(xiàn)lashield在段的bloom過(guò)濾器中執(zhí)行鍵查找。如果在bloom過(guò)濾器中找到鍵，F(xiàn)lashield將從flash上的段讀取對(duì)象。由于bloom過(guò)濾器可能導(dǎo)致假陽(yáng)性，如果從flash中讀取的對(duì)象與正在查找的對(duì)象沒(méi)有相同的鍵，那么將再次散列該鍵，F(xiàn)lashield將在查找散列表中再次查找該鍵。類似地，如果在bloom過(guò)濾器中沒(méi)有找到鍵，則再次散列鍵，F(xiàn)lashield在lookup散列表中執(zhí)行另一個(gè)查找。Flashield將嘗試使用所有配置的哈希函數(shù)(默認(rèn)為16)查找對(duì)象，直到找到對(duì)象為止。如果在所有嘗試之后都沒(méi)有找到該對(duì)象，則該對(duì)象在flash中不存在，F(xiàn)lashield返回一個(gè)miss。

? ? ?圖6總結(jié)了哈希表?xiàng)l目格式。索引包含一個(gè)額外的位(ghost)，它指示對(duì)象是否計(jì)劃從flash中刪除。我們?cè)趚4.3中描述了這個(gè)標(biāo)志的用途。

實(shí)現(xiàn)：

????????本節(jié)介紹Flashield的實(shí)現(xiàn)。我們?cè)贑語(yǔ)言中從頭開(kāi)始實(shí)現(xiàn)Flashield，除了傳輸、分派、請(qǐng)求處理和DRAM對(duì)象的哈希表，這些都是從Memcached 1.4.15借來(lái)的。Flashield有四個(gè)主要功能:讀取、寫入、將數(shù)據(jù)移動(dòng)到flash和刪除。圖7描述了Flashield架構(gòu)的高級(jí)組件。它支持通用的Memcached協(xié)議，因此部署Memcached的應(yīng)用程序可以透明地使用Flashield。

????????對(duì)于讀取，F(xiàn)lashield首先檢查DRAM對(duì)象的哈希表中是否存在對(duì)象，該對(duì)象基于memcached的哈希表。如果沒(méi)有，它將使用一個(gè)單獨(dú)的哈希表來(lái)檢查對(duì)象是否仍然存在于flash中。如果對(duì)象存在于DRAM或flash中，F(xiàn)lashield將返回該對(duì)象，否則該請(qǐng)求將被視為一個(gè)錯(cuò)誤。傳入的寫和更新總是首先存儲(chǔ)在DRAM中。對(duì)于更新，更新后的對(duì)象存儲(chǔ)在DRAM中，舊版本無(wú)效。Flashield總是在DRAM中為傳入的寫保持一個(gè)段大小的空閑空間。

????????Flashield使用大量可配置的工作線程并行處理客戶機(jī)請(qǐng)求。為了在DRAM上保持足夠的空閑空間，F(xiàn)lashield使用了一個(gè)專用的干凈線程，它在后臺(tái)工作，并且不在正常請(qǐng)求(讀/寫)處理的關(guān)鍵路徑上。此外，F(xiàn)lashield讓操作人員配置一個(gè)flash寫限制，以確保一定的目標(biāo)生存期。當(dāng)DRAM上的空閑空間下降到段大小以下時(shí)，如果有足夠多的對(duì)象達(dá)到了flash評(píng)分的閾值，并且沒(méi)有達(dá)到flash寫速率限制，那么清理器將它們復(fù)制到段緩沖區(qū)中。當(dāng)緩沖區(qū)被填滿時(shí)，清理器將段寫入flash，然后釋放對(duì)象在DRAM中占用的空間。根據(jù)對(duì)象的flashiness評(píng)分，將對(duì)象按順序移動(dòng)到flash。當(dāng)SSD已滿時(shí)，清潔器將根據(jù)FIFO順序從flash中刪除最后一個(gè)段。

? ??????Flashield對(duì)所有對(duì)象保持全局優(yōu)先級(jí)，無(wú)論它們是存儲(chǔ)在DRAM或flash中。基于這個(gè)全局優(yōu)先級(jí)，對(duì)象被從Flashield中驅(qū)逐。默認(rèn)情況下，優(yōu)先級(jí)是使用時(shí)鐘的LRU的近似值。如果下一個(gè)被驅(qū)逐的對(duì)象是在DRAM中，F(xiàn)lashield只會(huì)驅(qū)逐它。如果下一個(gè)要清除的對(duì)象在flash中，F(xiàn)lashield將它標(biāo)記為ghost對(duì)象，當(dāng)它的段從flash中刪除時(shí)，它將被清除。注意，將數(shù)據(jù)從DRAM移動(dòng)到flash是與清除解耦的。它們是并行進(jìn)行的，并使用不同的度量對(duì)對(duì)象進(jìn)行排序。在flash和DRAM之間移動(dòng)的對(duì)象總是保持它們的全局優(yōu)先級(jí)排序。當(dāng)DRAM中沒(méi)有足夠的對(duì)象達(dá)到flash評(píng)分的閾值，或者flash寫入速度達(dá)到極限時(shí)，清理器將從DRAM中刪除條目，以保持足夠的空閑空間。

????????本節(jié)的其余部分將詳細(xì)描述Flashield如何將對(duì)象移動(dòng)到flash中，以及Flashield分類器和清除算法的實(shí)現(xiàn)。

向Flash寫入對(duì)象：

? ??????Flashield在DRAM中構(gòu)建了一個(gè)flash綁定段，通過(guò)一個(gè)接一個(gè)地為段中的對(duì)象尋找空間。預(yù)先確定的哈希函數(shù)的輸出位為每個(gè)對(duì)象在段中提供不同的可能插入點(diǎn)。Flashield首先根據(jù)對(duì)象的flashiness組合一組需要移動(dòng)到flash的對(duì)象。然后，它嘗試根據(jù)對(duì)象的大小從這個(gè)組中插入對(duì)象。首先是大對(duì)象，因?yàn)樗鼈儽刃?duì)象需要更多的連續(xù)空間。在這個(gè)過(guò)程中，一些對(duì)象在段中沒(méi)有可用的空間。Flashield跳過(guò)這些對(duì)象，并試圖在下次創(chuàng)建新段時(shí)再次插入它們。我們?cè)趚 5.3中評(píng)估結(jié)果段的利用率。

分類器的實(shí)現(xiàn)：

? ??????Flashield的flashiness評(píng)分是根據(jù)每個(gè)對(duì)象的兩個(gè)特性計(jì)算的。由于這些特性依賴于跨多個(gè)對(duì)象訪問(wèn)的信息，因此對(duì)象的特性僅在至少讀取一次對(duì)象之后生成。如果一個(gè)對(duì)象從未被讀取過(guò)，那么它的flashiness值將自動(dòng)等于零。

????????Flashield定期為每個(gè)應(yīng)用程序訓(xùn)練一個(gè)單獨(dú)的分類器。對(duì)于我們使用的商業(yè)跟蹤，我們發(fā)現(xiàn)在跟蹤開(kāi)始時(shí)一個(gè)小時(shí)的培訓(xùn)時(shí)間就足夠了。訓(xùn)練分類器的原始方法是在每次訪問(wèn)DRAM時(shí)更新特性。但是，這種方法可能會(huì)過(guò)度使用某些對(duì)象，從而導(dǎo)致分類器不平衡。例如，如果一個(gè)小的對(duì)象集占所有訪問(wèn)的99%，那么將為這些對(duì)象創(chuàng)建多個(gè)特性集，并且flash估計(jì)將偏向于流行對(duì)象。

????????為了解決這個(gè)問(wèn)題，我們實(shí)現(xiàn)了一種抽樣技術(shù)，該技術(shù)為每個(gè)對(duì)象生成一個(gè)單獨(dú)的抽樣，在訓(xùn)練期間對(duì)其所有訪問(wèn)進(jìn)行統(tǒng)一選擇。Flashield沒(méi)有在每次對(duì)象訪問(wèn)時(shí)更新特性，而是只以1n的概率進(jìn)行更新，其中n是到目前為止讀取和更新對(duì)象的次數(shù)。

????????要演示這種抽樣技術(shù)，請(qǐng)考慮下面的示例。假設(shè)一個(gè)對(duì)象是第一次寫的，然后讀取。其特征向量為:1;0(過(guò)去的讀取次數(shù)，過(guò)去的更新次數(shù))。由于讀取和更新的次數(shù)等于1，因此第一次讀取生成的特征向量將是我們用于訓(xùn)練的特征，概率為1。更新對(duì)象時(shí)(特征向量為:1;1)， Flashield保留第二組特性的概率為12，因?yàn)樽x取和更新的次數(shù)等于2。這等于從第一次或第二次訪問(wèn)中均勻采樣特性。每次后續(xù)訪問(wèn)的采樣概率都是1n，之前訪問(wèn)的采樣概率也是相同的。

????????在收集了一個(gè)小時(shí)的樣本后，我們測(cè)量了在接下來(lái)的一個(gè)小時(shí)內(nèi)每個(gè)物體被擊中的次數(shù)。這個(gè)數(shù)字作為訓(xùn)練的目標(biāo)函數(shù)。經(jīng)過(guò)這兩個(gè)階段后，F(xiàn)lashield使用這些訓(xùn)練樣本和標(biāo)簽訓(xùn)練分類器。

Eviction：

????????Flashield使用時(shí)鐘算法對(duì)要驅(qū)逐的對(duì)象進(jìn)行排序。每個(gè)對(duì)象的哈希表?xiàng)l目中只有兩個(gè)表示優(yōu)先級(jí)的時(shí)鐘位，而不是保持精確的優(yōu)先級(jí)排序。為了近似LRU，當(dāng)讀取對(duì)象時(shí)，它的位都設(shè)置為1。MFU(最常用)的近似方法是每次讀取時(shí)將位增加1。

????????當(dāng)set操作將對(duì)象插入緩存時(shí)，可能會(huì)觸發(fā)驅(qū)逐。在清除時(shí)，F(xiàn)lashield循環(huán)遍歷索引中的每個(gè)對(duì)象條目，將其時(shí)鐘值遞減1。當(dāng)它到達(dá)一個(gè)時(shí)鐘值為零的條目時(shí)，它停止行走。這個(gè)物體是choo -sen作為下一個(gè)被驅(qū)逐的受害者。如果受害者對(duì)象在DRAM中，那么它的空間將被釋放，并且可以為即將到來(lái)的值重用。如果在釋放受害者之后有足夠的空間，驅(qū)逐就會(huì)停止，否則這個(gè)過(guò)程會(huì)根據(jù)需要重復(fù)。如果對(duì)象在flash中，F(xiàn)lashield不能立即從flash中刪除它，因?yàn)閷?duì)SSD的細(xì)粒度寫入會(huì)導(dǎo)致高DLWA。相反，條目被標(biāo)記為一個(gè)ghost對(duì)象，它充當(dāng)flash清理過(guò)程的提示。稍后，當(dāng)對(duì)象所在的on-flash段即將被覆蓋時(shí)，ghost對(duì)象將不會(huì)被預(yù)先服務(wù)，從而有效地將存儲(chǔ)釋放出來(lái)，作為批量flash清理過(guò)程的一部分。即便如此，如果ghost對(duì)象是與特定鍵關(guān)聯(lián)的最當(dāng)前值，那么它仍然是可訪問(wèn)的，只要flash清理過(guò)程還沒(méi)有覆蓋它在flash上的段。在某種意義上，ghost對(duì)象接近全局清除級(jí)別的底部(包括兩個(gè)flash)和DRAM);非鬼對(duì)象，被認(rèn)為是在全球驅(qū)逐排名的頂端，我們稱之為熱對(duì)象。

????????Flashield在分配一個(gè)新段并準(zhǔn)備將其從DRAM移動(dòng)到flash時(shí)觸發(fā)段刪除，前提是flash已滿且未超過(guò)配置的寫速率限制。清潔器按FIFO順序從flash中刪除最后一個(gè)段。在段擦除期間，它的ghost對(duì)象將從緩存中刪除，而熱對(duì)象將重新插入DRAM。圖8總結(jié)了這個(gè)過(guò)程。

????????將對(duì)象從flash移動(dòng)回DRAM將觸發(fā)驅(qū)逐;如果不選中此選項(xiàng)，將會(huì)產(chǎn)生兩個(gè)問(wèn)題。首先，如果過(guò)早地將對(duì)象從DRAM中刪除，而沒(méi)有證明它們是華麗的，那么命中率可能會(huì)受到影響。其次，如果清除了太多花哨的對(duì)象，就會(huì)導(dǎo)致寫入放大。Flashield通過(guò)一個(gè)熱數(shù)據(jù)閾值(HDT)來(lái)防止這種情況發(fā)生，它確保在有限的時(shí)間內(nèi)可以丟棄足夠多的對(duì)象，從而在flash上釋放足夠的空間，而不會(huì)對(duì)清除造成太大的壓力。在沒(méi)有HDT的情況下，清理器可以重新分配低級(jí)別對(duì)象，以犧牲駐留在DRAM中的高級(jí)別對(duì)象為代價(jià)。

HDT定義為DRAM + SSD hot，其中DRAM是DRAM中可用的對(duì)象存儲(chǔ)，SSD是SSD的總大小，hot是分配給熱對(duì)象的SSD的百分比。Flashield努力維護(hù)HDT，即使傳入的對(duì)象在DRAM中有足夠的空間。為此，每當(dāng)熱數(shù)據(jù)量超過(guò)HDT時(shí)，F(xiàn)lashield就會(huì)觸發(fā)一個(gè)新的清除，如果其他對(duì)象駐留在flash上，則會(huì)將其標(biāo)記為ghost。默認(rèn)情況下，hot是70%，所以flash上大約30%的對(duì)象是ghost對(duì)象。

Ghost對(duì)象被標(biāo)記為Ghost之后仍然可以訪問(wèn)，因?yàn)樗鼈儾粫?huì)立即從flash中刪除。如果訪問(wèn)了ghost對(duì)象，它就不再被認(rèn)為是ghost, Flashield將其標(biāo)記為熱對(duì)象(ghost位設(shè)置為零)。由于Flashield總是維護(hù)HDT，所以將ghost對(duì)象從ghost切換到hot可能會(huì)觸發(fā)驅(qū)逐。為了避免不必要的DRAM清除，在這種情況下，F(xiàn)lashield不會(huì)從DRAM中驅(qū)逐低等級(jí)的對(duì)象，而只是遍歷flash對(duì)象來(lái)將對(duì)象標(biāo)記為幽靈。

盡管清理器負(fù)責(zé)在DRAM中維護(hù)足夠的空閑空間(通過(guò)向flash分配新段)，但在極少數(shù)情況下，DRAM可能沒(méi)有足夠的空閑空間來(lái)容納傳入的寫。當(dāng)flash寫入速率達(dá)到極限時(shí)，或者當(dāng)flash -ss得分超過(guò)閾值的對(duì)象數(shù)量不足以形成一個(gè)新的段時(shí)，可能會(huì)發(fā)生這種情況。在這種情況下，F(xiàn)lashield將觸發(fā)一個(gè)特殊的清除，它將只遍歷DRAM對(duì)象，并將從DRAM中驅(qū)逐低級(jí)別對(duì)象以容納傳入的寫。

圖9展示了一個(gè)set操作向緩存插入新對(duì)象時(shí)Flashield的流程圖。

Flashield中的刪除操作不會(huì)引起對(duì)flash的寫操作。如果對(duì)象在DRAM中，則只刪除它。如果它駐留在flash中，則不會(huì)立即從flash中刪除它，因?yàn)檫@會(huì)導(dǎo)致DLWA。它也沒(méi)有被標(biāo)記為ghost，因?yàn)間host對(duì)象仍然可以被訪問(wèn)。相反，F(xiàn)lashield刪除對(duì)象的查找條目。在段刪除期間，清理過(guò)程通過(guò)將其對(duì)應(yīng)的查找條目中的段ID與被刪除的段ID進(jìn)行比較來(lái)標(biāo)識(shí)已刪除的對(duì)象，并且不會(huì)保存它們。在此基礎(chǔ)上，F(xiàn)lashield將更新操作處理為刪除操作，然后進(jìn)行新的插入。

Evaluation：

在本節(jié)中，我們?cè)u(píng)估了與現(xiàn)有系統(tǒng)相比，F(xiàn)lashield的端到端性能。不幸的是，據(jù)我們所知，沒(méi)有大規(guī)模鍵值緩存的公共蹤跡。我們使用Memcachier提供的整個(gè)星期的實(shí)際跟蹤，Memcachier是一個(gè)廣泛使用的memcached服務(wù)提供商。由于Memcachier跟蹤在請(qǐng)求率方面相當(dāng)稀疏，所以我們運(yùn)行了一組合成的微基準(zhǔn)測(cè)試來(lái)強(qiáng)調(diào)系統(tǒng)的性能，以度量它的吞吐量和延遲。

端到端性能：

通過(guò)從Memcachier跟蹤中重新運(yùn)行實(shí)際應(yīng)用程序，我們比較了Flashield到RIPQ和受害者緩存策略的端到端命中率和寫入放大。由于RIPQ沒(méi)有公開(kāi)的[38]實(shí)現(xiàn)，我們不得不運(yùn)行并比較這三個(gè)系統(tǒng)的仿真。每個(gè)策略都使用Memcachier跟蹤中分配的相同數(shù)量的內(nèi)存，DRAM和SSD的比例為1:7。我們運(yùn)行Flashield，其閾值為一個(gè)未來(lái)讀取。換句話說(shuō)，預(yù)測(cè)未來(lái)至少有一次讀取的對(duì)象被認(rèn)為是足夠閃速的。由于Flashield為每個(gè)應(yīng)用程序使用一個(gè)單獨(dú)的SVM，我們比較了單個(gè)應(yīng)用程序的結(jié)果。要用8個(gè)插入點(diǎn)運(yùn)行RIPQ，并且在flash上至少運(yùn)行8個(gè)不同的段，我們只運(yùn)行Memcachier分配了足夠內(nèi)存的應(yīng)用程序。

表5給出了Flashield和RIPQ的比較結(jié)果。結(jié)果表明，F(xiàn)lashield的CLWA明顯低于RIPQ和受害者緩存。Flashield的CLWA中值為0.54,RIPQ中值為2.85，而受害者緩存的中值為3.67。即使Flashield對(duì)將來(lái)讀取的flash使用一個(gè)較低的閾值，它仍然阻止了大量不適合SSD的寫操作被寫入到flash中。Flashield和RIPQ有著幾乎相同的命中率。兩者的命中率都比vic-tim緩存低，但是受害者緩存的CLWA要高得多(因?yàn)樗惶幚鞤LWA，所以總體寫放大也要高得多)。

表6比較了不同閃度預(yù)判閾值下的Flashield。不同應(yīng)用的結(jié)果不同，一般來(lái)說(shuō)，閾值越高，CLWA越低，命中率越低。注意，在一些應(yīng)用程序中，例如在應(yīng)用程序a中，這種權(quán)衡并不適用，因?yàn)槲覀冊(cè)诿總€(gè)應(yīng)用程序上分別訓(xùn)練分類器，并且每個(gè)應(yīng)用程序的執(zhí)行方式不同。

表7描述了在保持每個(gè)應(yīng)用程序的內(nèi)存總量不變的情況下，改變DRAM和SSD的比例時(shí)的結(jié)果。結(jié)果表明，如果我們過(guò)多地減少DRAM的數(shù)量，系統(tǒng)的命中率就會(huì)下降。這是因?yàn)?，?dāng)DRAM較低時(shí)，對(duì)象沒(méi)有足夠的時(shí)間證明自己足夠華麗，可以在從DRAM中移除之前移動(dòng)到SSD。注意，我們?cè)谶@些運(yùn)行中使用了更小的段大小，以便能夠以1:15的DRAM比例顯示結(jié)果。

Microbenchmarks：

我們使用微基準(zhǔn)來(lái)驅(qū)動(dòng)Flashield的實(shí)現(xiàn)，以強(qiáng)調(diào)系統(tǒng)的性能，并使用Memcached來(lái)減少它的延遲和吞吐量。我們使用4核3.4 GHz Intel Xeon E3-1230 v5(共8個(gè)硬件線程)，32 GB的DDR4 DRAM (2133 MHz)和480 GB Intel 535系列SSD。所有實(shí)驗(yàn)都是使用Debian 8.4 AMD64上的標(biāo)準(zhǔn)內(nèi)核、編譯器和庫(kù)編譯和運(yùn)行的。微基準(zhǔn)測(cè)試請(qǐng)求基于隨機(jī)鍵，平均對(duì)象大小為257字節(jié)，這是Memcachier跟蹤中前20個(gè)應(yīng)用程序的平均對(duì)象大小。我們禁用了操作系統(tǒng)緩沖區(qū)緩存，以確保SSD讀取被直接路由到SSD驅(qū)動(dòng)器。由于SSD和DRAM的性能相差一個(gè)數(shù)量級(jí)，我們分別測(cè)量了SSD和DRAM命中。最后，我們測(cè)量了Memcached 1.4.15的延遲和吞吐量作為基線。

表8給出了microbenchmark實(shí)驗(yàn)的吞吐量和延遲。注意，對(duì)于Memcachier和Facebook, Memcached都不是CPU綁定的，而是內(nèi)存容量綁定的[14,15]。Flashield中DRAM hits的延遲和吞吐量與Memcached的延遲和吞吐量非常相似。雖然SSD點(diǎn)擊率的平均延遲顯著高于DRAM，但是當(dāng)在網(wǎng)絡(luò)上部署時(shí)，它們的延遲變得相似(網(wǎng)絡(luò)訪問(wèn)時(shí)間通常為100秒或更長(zhǎng))。Flashield的miss延時(shí)與DRAM hits的延時(shí)相似，因?yàn)镕lashield的所有查找索引都存儲(chǔ)在DRAM中，只有當(dāng)內(nèi)存中的bloom過(guò)濾器之一返回false positive時(shí)，F(xiàn)lashield才需要在miss中訪問(wèn)flash。Flashield的寫吞吐量和延遲與Memcached相同，因?yàn)閷懣偸沁M(jìn)入Flashield的DRAM。

Utilization on Flash：

當(dāng)將數(shù)據(jù)從DRAM移動(dòng)到flash時(shí)，F(xiàn)lashield試圖使用預(yù)定義的哈希函數(shù)為flash段中不同可能的插入點(diǎn)分配對(duì)象空間。如果沒(méi)有插入點(diǎn)引用對(duì)象的足夠連續(xù)自由空間，F(xiàn)lashield將跳過(guò)對(duì)象，并嘗試在下一個(gè)段分配期間插入它。

圖10描述了Flashield的flash分配算法的使用情況。為了測(cè)量?jī)?nèi)存利用率，我們?cè)贛emcachier跟蹤上運(yùn)行Flashield分配算法，在512 MB的段大小上使用不同數(shù)量的哈希函數(shù)，分配貪婪地試圖分配空間給更多的數(shù)據(jù)，并測(cè)量結(jié)果的利用率。注意，當(dāng)段的利用率達(dá)到60%左右時(shí)，段的利用率曲線梯度下降，因?yàn)楫?dāng)Flashield試圖分配對(duì)象時(shí)，段中與其他前輔助對(duì)象發(fā)生碰撞的概率更高。使用16個(gè)散列函數(shù)，大約需要1gb的對(duì)象才能達(dá)到99%的利用率，平均每個(gè)對(duì)象需要散列8.2次，直到找到一個(gè)具有足夠空間的插入點(diǎn)。

總結(jié)：

SSD在采用鍵值緩存用例方面面臨著獨(dú)特的挑戰(zhàn)，因?yàn)檩^小的對(duì)象大小和頻繁的清除和更新速度會(huì)導(dǎo)致過(guò)多的寫操作和擦除操作。Flashield是第一個(gè)使用DRAM作為對(duì)象篩選器的鍵值緩存，這些對(duì)象不適合SSD。Flashield使用輕量級(jí)機(jī)器學(xué)習(xí)配置對(duì)象，并動(dòng)態(tài)學(xué)習(xí)和預(yù)測(cè)哪些對(duì)象最適合flash。它為可變大小的對(duì)象引入了一種新的內(nèi)存索引，每個(gè)對(duì)象的開(kāi)銷小于4字節(jié)，同時(shí)又不犧牲閃存的寫和讀放大。

本文的思想可以擴(kuò)展到其他用例。例如，非易失性內(nèi)存(NVM)也面臨持久性方面的挑戰(zhàn)，特別是在用作DRAM的替代品時(shí)，可能還需要一個(gè)允許策略[17]。這在多層存儲(chǔ)系統(tǒng)中也是如此，在多層存儲(chǔ)系統(tǒng)中，更便宜的存儲(chǔ)層以性能下降為代價(jià)提供更多的容量。最后，隨著flash的密度增加(其容忍寫操作的能力降低)，如何處理flash的持久性成為一個(gè)越來(lái)越緊迫的問(wèn)題。

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av

Flashield: a Hybrid Key-value Cache that Controls Flash Write Amplification

Flashield: a Hybrid Key-value Cache that Controls Flash Write Amplification

摘要：

背景：

問(wèn)題：

設(shè)備級(jí)的寫放大：

緩存級(jí)寫入放大：

設(shè)計(jì)：

? DRAM作為過(guò)濾器：

Flashiness：

? ??Flashiness設(shè)計(jì)的討論：

?DRAM作為Flash的索引：

實(shí)現(xiàn)：

向Flash寫入對(duì)象：

分類器的實(shí)現(xiàn)：

Eviction：

Evaluation：

端到端性能：

Microbenchmarks：

Utilization on Flash：

相關(guān)工作：

總結(jié)：

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九 欧美,1769亚洲,黄色成人av

Flashield: a Hybrid Key-value Cache that Controls Flash Write Amplification

摘要：

背景：

問(wèn)題：

設(shè)備級(jí)的寫放大：

緩存級(jí)寫入放大：

設(shè)計(jì)：

? DRAM作為過(guò)濾器：

Flashiness：

? ??Flashiness設(shè)計(jì)的討論：

?DRAM作為Flash的索引：

實(shí)現(xiàn)：

向Flash寫入對(duì)象：

分類器的實(shí)現(xiàn)：

Eviction：

Evaluation：

端到端性能：

Microbenchmarks：

Utilization on Flash：

相關(guān)工作：

總結(jié)：

相關(guān)閱讀更多精彩內(nèi)容

友情鏈接更多精彩內(nèi)容

色偷偷精品伊人,欧洲久久精品,欧美综合婷婷骚逼,国产AV主播,国产最新探花在线,九色在线视频一区,伊人大交九欧美,1769亚洲,黄色成人av