正大数据恢复中心
服务器数据环境:
广州某学校的戴尔某型号服务器:服务器内存在两组阵列,分别为2块500G磁盘组成RAID1磁盘阵列,6块6TB磁盘组成RAID5磁盘阵列;
两组磁盘阵列分配了三个磁盘卷,RAID1阵列组分配了一个卷安装操作系统,RAID5阵列组分配了两个卷,其中RAID5内储存着一个单节点的Oracle和若干干个共享文件夹。
RAID1:2*SAS接口500G硬盘 系统卷
RAID5:6*SAS接口6T硬盘 数据卷
服务器故障描述:
服务器运行过程中管理员收到反馈说共享文件夹无法访问,随后到机房检查发现RAID5阵列组3号5号硬盘处于红灯状态,服务器RIAD5阵列已崩溃离线,无法正常工作。发现故障后管理员第一时间进行了关机断电并联系我司进行数据恢复。
服务器恢复过程:
1、数据恢复工程师接到机器后立即对磁盘进行脱机检查,评估离线RAID阵列中所有磁盘的状态,发现阵列中存在先后离线的情况,3号磁盘在1个多月前已经离线,最新损坏的5号磁盘通电发现存在异响,已经发生物理损坏了,其他磁盘无明显物理故障。RAID5阵列只允许一块磁盘离线,当第二块磁盘离线后阵列就无法工作了。此次服务器的故障是因为5号磁盘的离线造成的,所以第5号磁盘中的数据是这次恢复的关键。
2、在经过用户同意后对损坏的5号盘进行开盘恢复,幸好在磁盘损坏后管理人员第一时间进行断电,内部碟片没有明显损伤,通过更换磁头组件进行数据提取,顺利获取整个磁盘的底层数据。
3、对故障服务器中所有好的硬盘做镜像备份,所有恢复操作都在镜像文件上进行,以保护原始数据环境。
4、工程师通过手工计算出阵列的组合参数,并虚拟重建RAID5结构和校验底层数据流是否正确。
5、再通过解析工具对文件系统进行解析,导出阵列内所有数据到客户机器的新建阵列中。
6、验收中发现Oracle数据库文件因非正常断电导致数据文件发生损坏,无法正常启动。经数据库工程师手工挂载并修复坏块,至此数据库和共享文件夹都能正常访问和使用。
服务器恢复后语:
服务器发生故障后管理员第一时间关机断电很好的保护关键的5号盘,毕竟这种高转速硬盘在发生物理问题后如果再长时间通电很可能会造成碟片划伤。也没有强行上线早期离线磁盘等错误操作,现场环境保存的比较完好使得恢复工作进行的比较顺利。
正大数据恢复中心提醒:发生故障后保护好存储介质,第一时间求助专业正规的服务器数据恢复机构,以免数据因错过最佳恢复时间而造成数据丢失。