上門時間:2015-10-26 10點接到通知
結束時間:2015-10-27 20:34回到濟南西站
事項:數據恢復客戶的DELL3200的數據,已經發給客戶,客戶自己不會添加到ESXI中,要求我們上門協助解決.
周一上午到了棗礦,做Esxi虛擬化系統集成的工程師已經在調試了,(原來濟南煤炭局數據恢復一塊合作過,所以比較熟悉)發現他的安裝存儲的管理軟件,還沒連上存儲,我們這里有,打開電腦,他應該是想知道存儲的iscsi口地址,看了下,告訴他這個我們在調試的時候應該改過了,最好能找到原來的IP,再改回去。
工程師把原來配置的存儲上的各網口地址告訴我們,我們就按他說的配置了一遍。工程師重新掃描了一下,發現原來的那些虛擬機并沒有找到,得再添加一下存儲。
他擔心添加的時候會把原來的數據刪除 ,我們告訴系統 會識別到之前 的格式,直接添加上就可以了。他試了一下,添加上幾個iscsi存儲,但是還是發現不了原來的虛擬機。
主管這時候告訴他下面的一個李姓工程師,要求下面的存儲重新配置一下RAID,跟下面的幾臺機器重新組成一個虛擬化系統 。李工說好,然后要求我們教他怎么配置這個存儲。
我們就把從安裝軟件起到配置RAID,及做熱備的方法教了他一遍,并現場把下面沒數據的存儲按他的要求做個RAID5,并且其中一塊盤做成了全局熱備進行了配置,(期間遇到幾個存儲的問題,一個是無法打開iscsi的網口配置界面,于是又讓李工找了個交換機把兩個控制 器都連接上;由此看來這個存儲其實控制器是有點問題的)
這時候客戶發現了一個問題,說上面的配置的虛擬機在重啟了之后ISCSI會自動斷開,三臺機器 都是這樣,還有兩臺機器 無法連接存儲上的LUN,一添加就提示讓格式化。
我們這時候看了一下機柜上的機器,上面總共有五臺R710,全是裝的ESXI4.1,通過交換機連接到我們找回數據的這個存儲的上控制器的前2個網口,下面還有2臺NF500D2,通過網口直連的方式連著剛才我新配置的沒有數據的存儲,連的是存儲的下面的控制器1號和2號網口,當然 還沒連上,因為 還沒有做映射 ,剛才說的是物理的連接。
我們跟著主管把服務器全都停掉,存儲全都斷了電,等了十幾分鐘之后先啟動存儲,再啟動服務器,發現iscsi連接可以自動建立 ,但是不能自動添加存儲,虛擬機當然 也無法找到。
徐總說我們找回數據 的存儲上有些數據校驗不過去,是有問題的,不要在生產環境上用,需要的話就把數據 拷出來 。于是我給客戶說了這種情況,要求用剛才新做RAID的存儲當作一個中轉介質,把里面的虛擬機文件拷出來,在另外一臺存儲上當作 生產環境。客戶同意了這種作法,于是和工程師商量了一下,決定把所有的設備都通過機柜上面的交換機進行連接,這樣一來拷貝數據 的時候快,二來配置起來也方便。于是找了幾根網線,把設備都接到了交換機上。
存儲上的數據 量非常大,如果全拷的話肯定 不可行,客戶說,那就撿著重要的先拷。
工程師在下面的兩臺NF500D2上部署了一個虛擬機管理中心,把所有的ESXI都放到這個管理中心里,這樣就可以直接在這臺機器上對所有的機器 進行部署了。
兩邊存儲都連上之后工程師使用虛擬機遷移工具進行遷移,我們給他說最好使用復制的方法,他似乎沒用過文件夾復制 的方法,我們告訴他怎么操作之后他也覺得使用復制 更安全一點。
第二天到了現場,昨天晚上部署的任務多數都完成了,還有幾個在拷,有兩個失敗了的,應該是部署的任務太多,等這些結束了之后再接著拷就可以。
主管要求的最重要的兩個虛擬機已經拷貝完成了,于是嘗試著啟動,第一臺是微震的服務器,里面跑的centos7,裝的是每天上傳的一些報表 的數據 ,用的是LAMP,機器 啟動了之后從另外 一臺同網段的機器進行訪問的時候,發現無法訪問,于是主管打電話找原來程序 部署的工程師遠程看一下,但是那個工程師現在在外面,無法直接操作。主管就向我們求助,我們幫著他找了一下,并通過電話向部署的工程師問了一此配置之后將本地的服務啟動起來。
但是在同網段的另外 的機器 仍然無法訪問。我通過數據庫 查了一下,發現數據 有幾百萬條,那邊 部署的工程師說這樣的話應該數據 都在。別的機器 不能訪問,我考慮了一下判斷 是防火墻 的原因,于是就把機器 的防火墻 關掉。果然 ,外面的機器 就可以訪問了。主管查了一下,數據 都正常。
第二臺是一個WIN2003,信息科領導試著處理,說應該沒什么問題。于是皆大歡喜。
客戶希望我幫他們啟動了一下,系統 可以啟動應該可以證明數據 沒有問題,數據庫 啟動不了要么是沒有設置自動啟動,要么是數據庫 之前 就損壞了。于是我直接使用sysdba登錄,并且嘗試打開數據庫 。但是發現數據庫 可以掛載,但是找到的時候就報01595錯誤,查了一下判斷 是undo表空間損壞,于是把當前 的oracle系統 啟動到掛載階段,并且把當前參數保存成pfile,然后修改參數 里的undo表空間的管理方式然后從pfile啟動數據庫,發現可以打開。
這時候把原來的undo表空間給刪除,新建 了一下給了系統 。接著把原來的數據庫的spfile刪除 ,并且把當前的參數文件又生成了一份新的spfile。再重新啟動數據庫 ,發現數據庫 可以正常打開。
此時已經是下午1點多,主管打電話讓那邊 的人查了一下數據,那邊 說沒有數據了!我一想,不應該啊,沒有動數據庫 ,只是改了一下表空間配置文件,怎么會沒有了呢。于是主管要過用戶名和密碼登錄了一下,發現真的沒有數據 ,在幾個頁面點了一下,發現有的頁面也報了錯,是oracle的錯,報的是01552, 發現是非系統 表不能使用系統 的表空間,通過討論找到了解決方法,表空間的管理方式改成自動就可以了。
重要的機器 都啟動了,客戶要求恢復到生產狀態,并且做一下重啟測試。于是工程師把機柜的所有的線都插回到最初的樣子,此時所有的虛擬機已經遷移 到了下面的NF500D2上,所以上面的機器 就不太重要了。去重啟的時候發現最初有數據 的存儲其中一塊盤又壞了!我們都慶幸,數據 及時拷貝了出來 。
重啟測試之后一切正常。
注:重要的數據一定要注意備份,同時加強設別的巡檢與維護!
濟南鑒信DATAHELP服務器數據恢復中心
數據恢復服務熱線:0531-62399989
數據恢復服務電話:0531-62399989
公司傳真:0531-55575577
數據恢復業務Mail:DATAHELP@163.COM
數據恢復公司地址:濟南市山大路157號華強電子世界三樓Q3059,Q3060