一次raid10数据恢复 达思科技

中国教育装备采购网2015-02-16 09:54围观1260次我要分享

  数据恢复客户:

  山西某单位

  硬件环境:

  IBM DS4300存储,一共10块146GB光纤接口硬盘,做的是RAID10架构,就是每两块盘做成RAID1,一共5组RAID1,然后这5组RAID1又配置成一个RAID0,这就是所谓的混合型RAID10.DS4300阵列挂接在IBM小型机上,划分成AIX JFS2文件系统。

  故障描述:

  硬盘编号从1-10,其中1-2、3-4、5-6、7-8、9-10分别是5组RAID1,其中1-2这组RAID1以前更换过1号盘。现在出现了1号和2号盘同时亮黄灯,在Server Raid管理软件中这两个盘状态是OFFLINE状态。在这种架构上,如果这5组RAID1中只要坏掉一组,整个阵列就不能正常访问,在AIX上mount不上。

  raid10故障检测:

  经过Server Raid管理软件分析阵列日志信息,发现2号盘在10年8月份就出现异常,不参与RAID工作,1号盘在近期才出现错误。经过对1、2号盘进行检测和镜像,发现2号盘有少量坏道,1号盘能正常读取。

  数据恢复过程:

  经过对1号盘和2号盘进行检测和镜像以后,数据恢复工程师尝试把1号盘留在DS4300阵列上,把2号盘拔出来,然后在Server Raid管理软件中尝试各种办法使1号盘状态变成ONLINE状态,最后终于把1号盘变成ONLINE,于是尝试在AIX下查看相关VG信息,发现VG信息已经被破坏。数据恢复陷入下一步困境,经过对比1号盘和2号盘的头部信息,发现2号盘的头部有相关VG信息,于是把2号盘VG信息Copy到1号盘相应位置,再次在AIX下查看VG信息、LV信息,这次VG信息完好,文件系统mount顺利,尝试启动oracle服务,发现oracle启动不了,报redo1.log文件错误,最后经过几番努力,oracle终于能起来了,赶紧exp出oracle中的数据,至此,数据恢复成功。

  数据恢复结果:

  数据100%恢复成功。

  数据恢复难点:

  LVM信息是本恢复的关键,1号盘LVM信息被破坏,数据恢复工程师从2号盘看到良好的LVM信息,COPY到1号盘的相应位置,才能使整个恢复得以顺利进行。

  对客户建议:

  DS4300上更换硬盘要注意,最好更换型号和固件版本跟原来一样的硬盘,本案例原1号盘坏过,现在的1号盘是替换原1号盘的新盘,型号和固件版本都跟原来的硬盘不一样,这样的硬盘在DS4300上运行时不稳定的,容易出现掉线的现象。DS4300对硬盘固件版本匹配要求比较高,更换硬盘千万要注意固件版本匹配问题。

  作者:达思数据恢复覃总

来源:达思凯瑞技术(北京)有限公司作者:达思凯瑞技术(北京)有限公司

相关阅读