|
磁盤(pán)陣列(Redundant Array of Inexpensive,簡(jiǎn)稱RAID)作為數(shù)據(jù)存儲(chǔ)的一種主要方式在許多企業(yè)中被大量采用。磁盤(pán)陣列是一種安全可靠的數(shù)據(jù)存儲(chǔ)備份方式,但是磁盤(pán)陣列系統(tǒng)本身也存在著安全性的問(wèn)題,也需要對(duì)其本身進(jìn)行管理維護(hù)。若管理不到位,系統(tǒng)一旦出問(wèn)題,很難用手工方式恢復(fù),會(huì)給企業(yè)帶來(lái)不必要的損失。因此根據(jù)不同的業(yè)務(wù)數(shù)據(jù)量、不同的數(shù)據(jù)安全性要求,并結(jié)合使用的磁盤(pán)陣列產(chǎn)品技術(shù)支持情況,制定適合的管理維護(hù)措施,可以避免系統(tǒng)出錯(cuò),保證整個(gè)網(wǎng)絡(luò)系統(tǒng)中數(shù)據(jù)的安全。
注意檢查運(yùn)行日志文件
磁盤(pán)陣列的日志文件詳細(xì)記錄了磁盤(pán)陣列內(nèi)部運(yùn)行情況,包括發(fā)生的每個(gè)事件序列號(hào)、嚴(yán)重級(jí)別、相關(guān)的服務(wù)器IP地址、有關(guān)設(shè)備的具體位置及事件發(fā)生的時(shí)間等內(nèi)容,這些信息對(duì)于診斷和排除磁盤(pán)陣列故障十分有用。做好日志文件的日常管理工作,往往能起到防患與未然的作用。采用RAID數(shù)據(jù)冗余技術(shù),即使有一個(gè)物理磁盤(pán)損壞,也不會(huì)影響系統(tǒng)正常運(yùn)行和數(shù)據(jù)的I/O,用戶也仍能夠正常訪問(wèn)服務(wù)器,這時(shí)故障不易被察覺(jué),但陣列實(shí)際上已處于安全臨界狀態(tài),下一步就會(huì)面臨著突然宕機(jī)和存儲(chǔ)數(shù)據(jù)隨時(shí)丟失的危險(xiǎn),日志文件及時(shí)將這一情況記錄在冊(cè),損壞的磁盤(pán)記錄為下線(off line),其所在陣列記錄為臨界狀態(tài)(critical),通過(guò)檢查日志就能夠及時(shí)發(fā)現(xiàn)陣列運(yùn)行中存在的這個(gè)錯(cuò)誤和隱患,迅速排除故障,保證陣列始終處于安全運(yùn)行狀態(tài)。
注意備份系統(tǒng)配置參數(shù)
建立磁盤(pán)陣列系統(tǒng)后,要及時(shí)記錄磁盤(pán)陣列的邏輯配置、物理配置、狀態(tài)配置等參數(shù),具體包括使用的每個(gè)邏輯盤(pán)大小、RAID類型、條帶容量、數(shù)據(jù)寫(xiě)入磁盤(pán)方式、由哪些物理磁盤(pán)組成,每個(gè)物理磁盤(pán)的通道號(hào)、目標(biāo)序列號(hào)、生產(chǎn)廠家、型號(hào)、容量、陣列控制器的型號(hào)、固件(Firmware)版本,處于后備待機(jī)狀態(tài)(Hot Spare)還是在線狀態(tài)(On Line)等。上述配置參數(shù)在磁盤(pán)陣列或操作系統(tǒng)崩潰后,在緊急重建陣列、恢復(fù)存儲(chǔ)數(shù)據(jù)的過(guò)程中是必不可少的。一般陣列控制器BIOS芯片裝載了陣列配置軟件,管理員以文件形式備份上述參數(shù)。
定時(shí)備份重要數(shù)據(jù)
配備了磁盤(pán)陣列并不意味著可以高枕無(wú)憂了,由于考慮設(shè)備投入成本、技術(shù)復(fù)雜性等因素,不可能同時(shí)采用陣列控制器冗余、磁盤(pán)冗余、熱備用磁盤(pán)、備用電池或雙UPS電源供電等技術(shù),所以,對(duì)于重要業(yè)務(wù)數(shù)據(jù)一定要備份。在美國(guó)“9·11”事件中,正是靠磁帶備份和遠(yuǎn)程容災(zāi)系統(tǒng)挽救了金融界巨頭摩根斯坦利公司,由此可見(jiàn)數(shù)據(jù)備份工作的重要性。數(shù)據(jù)備份的介質(zhì)可以是磁帶、可讀寫(xiě)光盤(pán),也可以還是磁盤(pán)。備份方式可以是通過(guò)操作系統(tǒng)本地備份或通過(guò)網(wǎng)絡(luò)系統(tǒng)遠(yuǎn)程備份。
建立熱備用磁盤(pán)
熱備用磁盤(pán)也是RAID技術(shù)的又一項(xiàng)技術(shù),當(dāng)磁盤(pán)陣列中一個(gè)正在使用的物理磁盤(pán)發(fā)生故障后,一個(gè)待機(jī)的磁盤(pán)會(huì)立刻上線,代替此故障盤(pán),陣列控制器根據(jù)邏輯驅(qū)動(dòng)器上的冗余數(shù)據(jù),通過(guò)校驗(yàn)算法把原來(lái)存儲(chǔ)在故障盤(pán)上的數(shù)據(jù)重建到熱備用磁盤(pán)上。成為熱備用磁盤(pán)必須有三個(gè)條件:一是有不小于故障盤(pán)的容量;二是平時(shí)不得存儲(chǔ)任何數(shù)據(jù),也就是閑置不用;三是陣列控制器自動(dòng)重建數(shù)據(jù)功能有效。在一個(gè)陣列中,只能有一個(gè)熱備用磁盤(pán)。熱備用磁盤(pán)增加了一次數(shù)據(jù)逃生的機(jī)會(huì),系統(tǒng)管理員要及時(shí)更換發(fā)生故障的磁盤(pán),并指定新的熱備用磁盤(pán)。
定期檢查數(shù)據(jù)一致性
數(shù)據(jù)冗余是磁盤(pán)陣列主要技術(shù)之一,磁盤(pán)陣列通過(guò)數(shù)據(jù)冗余達(dá)到容錯(cuò)目的,但是由于各種原因,難免會(huì)遇到冗余數(shù)據(jù)與主數(shù)據(jù)塊(Primary Data)不一致的情況,結(jié)果造成數(shù)據(jù)失效甚至宕機(jī)等現(xiàn)象。一致性檢查能及時(shí)發(fā)現(xiàn)和糾正潛在的錯(cuò)誤數(shù)據(jù),保證陣列中數(shù)據(jù)的完整性。通過(guò)對(duì)RAID互為鏡像的磁盤(pán)數(shù)據(jù)一致性檢查,或者主數(shù)據(jù)塊進(jìn)行重新校驗(yàn),將產(chǎn)生的校驗(yàn)數(shù)據(jù)與冗余數(shù)據(jù)比較,都能發(fā)現(xiàn)不一致的錯(cuò)誤數(shù)據(jù)。一致性檢查一般間隔時(shí)間以每周1~2次為宜。
|
|
【收藏】【打印】【進(jìn)入論壇】 |
|
|
|
|
|
|
|