這篇文章是VMware虛擬機的數(shù)據(jù)恢復的一個案例,雖然整個VMware虛擬機的數(shù)據(jù)恢復過程只需要三步,但是前后的問題分析和經驗總結值得您借鑒。
對前幾天接手的一個VMWARE ESX SERVER的數(shù)據(jù)恢復案子進行一下總結
[數(shù)據(jù)恢復故障描述]
中石化某省分公司,信息管理平臺,幾臺VMware虛擬機——ESX SERVER共享一臺IBM DS4100存儲,大約有40~50組虛擬機,占用1.8TB空間,數(shù)據(jù)重要。
正常工作中,vc里報告虛擬磁盤丟失,ssh到ESX中執(zhí)行fdisk -l查看磁盤,發(fā)現(xiàn)storage已經沒有分區(qū)表了。重啟所有設備后,ESX SERVER均無法連接到DS4100所在的STORAGE。
仔細詢問當時的管理員,他們提到一點,曾經在這個存儲網絡里連接過一臺windows 2003服務器,具體情況不詳。
[數(shù)據(jù)恢復分析]
很自然地想到了,可能是那臺windows 2003因對storage的獨享操作導致了整個vmfs卷損壞。
以整個存儲做分析發(fā)現(xiàn):
1、分區(qū)表清0,有55aa有效結束標志,有硬盤ID標志。
2、簡單從前向后查看,發(fā)現(xiàn)一個NTFS卷,但似乎并未寫數(shù)據(jù)進去,像一個剛剛格式化的卷,對這個NTFS卷的BITMAP做分析,得知大小約為1.8T(全部空間),前部占用部分空間,3G左右位置占用部分空間,0.9T附近占用部分空間,但總占用空間不超過100M。
3、針對VMFS卷進行分析,發(fā)現(xiàn)在原1.8TB的磁盤里有2組VMFS分區(qū),第2組是對第一組的extend,第一組約1.5T,第二組約300GB,因NTFS分區(qū)并未寫數(shù)據(jù)到第二個VMFS分區(qū)里(最后一個扇區(qū)的DBR備份沒有覆蓋有用數(shù)據(jù)),所以重點在于第一個VMFS分區(qū)。
4、分析第一組VMFS,卷頭結構丟失,一級索引、二級索引均存在,NTFS覆蓋的數(shù)據(jù)區(qū)正好是某組虛擬機的臨時內存鏡像,損壞也無妨。
[數(shù)據(jù)恢復過程只要三步]
1、對整個STORAGE進行鏡像備份。
2、分析后,連接兩個VMFS分區(qū),直接按照VMFS分析組織方式提取所有VMDK及配置文件。
3、通過nfs直接遷移回ESX SERVER。
另:本例中因已對故障存儲做了安全備份,修復中同時直接重建第一組VMFS卷頭,索引列表、分區(qū)表等信息,直接附加在ESX SERVER環(huán)境,算是第二個方案。
[數(shù)據(jù)恢復結果]
花費2天時間(不計之后的遷移時間),全部數(shù)據(jù)恢復成功
[其他]
1、本例中依然是因為光纖環(huán)境互斥不當導致的問題,實際上,應該是這個卷在WINDOWS系統(tǒng)做了重新分區(qū),并格式化成了NTFS,之后又對分區(qū)做了刪除操作。因ESX VMFS的互斥不依賴于硬件,只依賴于操作系統(tǒng)驅動層,所以在其他服務器接入存儲網絡時一定要小心,盡量考慮好存儲分配權限。
2、ESX因便捷的信息集中管理,真正使用中往往數(shù)據(jù)特別重要,一定要做好備份工作,并考慮損壞時遷移的方便性。
以上就是本文的全部內容,希望對大家的學習有所幫助,也希望大家多多支持服務器之家。