【用戶單位】 XXXX網(wǎng)站 【數(shù)據(jù)恢復(fù)故障描述】 DELL POWEREDGE 2850服務(wù)器,內(nèi)置6塊300G SCSI硬盤 ,,組成RAID5,,安裝LINUX REDHAT 4操作系統(tǒng),存儲(chǔ)大量照片,,文件系統(tǒng)采用EXT3,。據(jù)后期推斷,早先已有一塊硬盤離線,,但機(jī)房?jī)?nèi)并未發(fā)現(xiàn),,直至另一塊硬盤掉線后系統(tǒng)癱瘓才知道。DELL工程師建議將其中一塊硬盤強(qiáng)制上線,,但同時(shí)指出操作具有風(fēng)險(xiǎn),。用戶將某盤強(qiáng)制上線后,,發(fā)現(xiàn)操作系統(tǒng)啟動(dòng)時(shí)異常,感覺(jué)不妙,,于是關(guān)掉服務(wù)器,,尋求專業(yè)數(shù)據(jù)恢復(fù)機(jī)構(gòu)服務(wù)。 【數(shù)據(jù)恢復(fù)故障分析】 此類故障非常普遍,,RAID5僅支持唯一一塊硬盤掉線的冗余保護(hù),,當(dāng)兩塊硬盤先后離線后,RAID即無(wú)法通過(guò)運(yùn)算提供完整數(shù)據(jù)塊,,RAID便會(huì)下線,。同時(shí),控制器為了穩(wěn)定起見(jiàn),,只要有硬盤下線,,便不會(huì)自動(dòng)上線,這樣不通過(guò)人為干預(yù),,RAID但會(huì)進(jìn)入癱瘓狀態(tài),。通常情況下,因RAID控制器的敏感性,,掉線的硬盤多數(shù)不會(huì)有嚴(yán)重的物理問(wèn)題,,許多甚至于硬盤完好(掉線是因?yàn)樾盘?hào)受阻,電源波動(dòng)或控制器BUG等隨機(jī)原因),,所以數(shù)據(jù)恢復(fù)的可靠性較高,。強(qiáng)制上線具有較大的風(fēng)險(xiǎn),如果上線錯(cuò)誤,,會(huì)導(dǎo)致控制器自動(dòng)做某些不可逆的操作,,如果再進(jìn)入操作系統(tǒng),,因文件系統(tǒng)不一致,,會(huì)導(dǎo)致修復(fù),繼而導(dǎo)致全部硬盤數(shù)據(jù)不一致,。本例即是如此,。 【數(shù)據(jù)恢復(fù)過(guò)程】 1、完整備份所有硬盤,,發(fā)現(xiàn)有多塊硬盤已經(jīng)存在壞道,,只是RAID沒(méi)有讀到,暫時(shí)無(wú)下線,。 2,、在備份中分析原來(lái)RAID的組成結(jié)構(gòu),構(gòu)建虛擬RAID環(huán)境,。 3,、驗(yàn)證RAID結(jié)構(gòu)正確,,修正部分后期破壞的結(jié)構(gòu)后將數(shù)據(jù)導(dǎo)出到另一中間存儲(chǔ)。 4,、重新用完好硬盤搭建DELL 2950上的新RAID5,。 5、將數(shù)據(jù)遷移至新RAID,。 【數(shù)據(jù)恢復(fù)結(jié)論】 歷時(shí)2天,,數(shù)據(jù)庫(kù)100%恢復(fù)成功。上千萬(wàn)圖片文件中抽樣檢測(cè),,有極少數(shù)出現(xiàn)問(wèn)題(概率及理論推斷,,不超過(guò)萬(wàn)分之一) 【數(shù)據(jù)恢復(fù)服務(wù)承諾】 1 .免費(fèi)檢測(cè) 2. 與客戶簽訂保密協(xié)議(非定制免費(fèi)),對(duì)客戶的數(shù)據(jù)嚴(yán)格保密 3. 數(shù)據(jù)恢復(fù)不成功不收費(fèi) 4. 專業(yè)工程師提供服務(wù),,同時(shí)由其他工程師審核,、會(huì)診數(shù)據(jù)恢復(fù)方案及流程 5. 數(shù)據(jù)恢復(fù)前報(bào)價(jià),客戶確認(rèn)后工程師開(kāi)始數(shù)據(jù)修復(fù) 6. 整個(gè)恢復(fù)過(guò)程不會(huì)對(duì)客戶的原盤有任何的寫操作,,以確保原盤的數(shù)據(jù)完全 |
|