我們所知道的服務(wù)器內(nèi)存技術(shù)主要有奇偶校驗(yàn)技術(shù)、ECC技術(shù)和IBM的Chipkill-correctECC技術(shù)。其實(shí)還有兩種內(nèi)存冗余技術(shù):內(nèi)存熱備和內(nèi)存鏡像?,F(xiàn)在重點(diǎn)了解下內(nèi)存熱備技術(shù)。
內(nèi)存熱備英文為Sparing,進(jìn)行內(nèi)存熱備時(shí),做熱備份的內(nèi)存在正常情況下是不使用的,也就是說系統(tǒng)是看不到這部分內(nèi)存容量的。每個(gè)內(nèi)存通道中有一個(gè)DIMM不被使用,預(yù)留為熱備內(nèi)存。芯片組中設(shè)置有內(nèi)存校驗(yàn)錯(cuò)誤次數(shù)的閾值, 即每單位時(shí)間發(fā)生錯(cuò)誤的次數(shù)。當(dāng)工作內(nèi)存的故障次數(shù)達(dá)到這個(gè)“容錯(cuò)閾值”,系統(tǒng)開始進(jìn)行雙重寫動(dòng)作,一個(gè)寫入主內(nèi)存,一個(gè)寫入熱備內(nèi)存,當(dāng)系統(tǒng)檢測(cè)到兩個(gè)內(nèi)存數(shù)據(jù)一致后,熱備內(nèi)存就代替主內(nèi)存工作,故障內(nèi)存被禁用,這樣就完成了熱備內(nèi)存接替故障內(nèi)存工作的任務(wù),有效避免了系統(tǒng)由于內(nèi)存故障而導(dǎo)致數(shù)據(jù)丟失或系統(tǒng)宕機(jī)。這個(gè)做熱備的內(nèi)存容量應(yīng)大于等于所在通道的最大內(nèi)存條的容量,以滿足內(nèi)存數(shù)據(jù)遷移的最大容量需求。