freenas中raid5状态停止

核心提示1 服务器硬件出现故障或者RAID阵列卡故障;2 服务器意外断电导致磁盘阵列故障;3 服务器阵列上的磁盘出现物理故障,如:电路板坏、磁头损坏、盘面坏、坏扇区、固件坏等;4 管理员在维护服务器过程中由于误操作导致硬盘盘序出现错误;5 raid

1 服务器硬件出现故障或者RAID阵列卡故障;

2 服务器意外断电导致磁盘阵列故障;

3 服务器阵列上的磁盘出现物理故障,如:电路板坏、磁头损坏、盘面坏、坏扇区、固件坏等;

4 管理员在维护服务器过程中由于误操作导致硬盘盘序出现错误;

5 raid在同步数据或者重建过程中,同组raid阵列中有其他硬盘掉线导致同步失败;

6 配置raid阵列信息出错等误操作导致数据丢失。

二、RAID5磁盘阵列故障后需要注意哪些问题

1 RAID5磁盘阵列出现故障或者数据丢失后建议不要盲目进行rebuild操作。

Rebuild操作就是利用阵列的校验功能,根据阵列内其他正常硬盘内的数据,将损坏硬盘的数据进行计算生成并同步到热备盘中。这种操作适合阵列中有1块硬盘掉线的情况,一旦阵列中有2块硬盘出现故障掉线了,则通常掉线顺序有先有后,如果在第一块硬盘掉线后服务器已经进行过写入操作的话,此时第一块掉线的硬盘数据已经久不更新,rebuild只能对先掉线的磁盘做Rebuild,如果对后掉线的磁盘进行重建操作,部分阵列虽然能正常工作,但数据错乱,一些文件不能打开,给用户带来不可挽回的损失。

2 如果有硬盘掉线不建议盲目进行强制上线操作。

在北亚数据恢复中心恢复的raid5数据恢复案例中,有部分raid阵列数据丢失原因是因为阵列中有一块硬盘离线以后没有及时更换硬盘,此后服务器出现故障或者正常重启,原本离线的硬盘重新上线,而原本在线的硬盘反而故障离线,数据不能正常使用。

用户对后离线的硬盘进行强制上线操作,磁盘阵列进行自动同步,导致数据新旧混乱,服务器数据丢失。因为原来离线的盘又自动上线,大多数阵列卡会检验校验信息,一旦发现校验信息不正确,会重新计算校验信息,致使不能缺盘恢复数据,将会数据恢复失败。

3 千万不要进行初始化操作。

初始化是一种类似于低级格式化的操作,一旦对阵列进行初始化操作,那么这个阵列内所有硬盘的底层数据将全部被清零,此时将导致阵列数据无法恢复。

4 重新配置磁盘阵列信息时要保证与原始配置信息一致。

如果需要重新配置磁盘阵列信息时,一定要注意与原始配置信息保持一致,一旦重新配置的参数与原始信息不一致,将导致阵列内多数文件无法打开,造成数据丢失。并且多数服务器都有重新配置阵列信息后自动初始化的功能,这将导致数据无法恢复。

5 在进行数据恢复尝试前请务必对服务器内的所有硬盘进行扇区级的镜像备份,避免破坏原始数据,如果有条件,可以联系数据恢复中心获取技术指导。

三、RAID5故障数据恢复方案

1 镜像服务器内所有数据。

按照一定的顺序将服务器内的所有硬盘进行排序编号,然后将每块硬盘进行镜像备份,也可以将服务器携带至北亚数据恢复中心,由数据恢复工程师进行镜像操作。

2 将镜像文件交给数据恢复中心进行底层数据分析,重组raid阵列,导出用户数据。

3 对导出的所有数据进行验证,确认无误后重新搭建服务器环境,将恢复的数据迁移回服务器内即可。

怎么排除服务器中RAID5故障

磁盘阵列 当中 任意一块硬盘出现故障 或被认为取下 那么 这个阵列瘫痪

黄灯 亮 也许 有故障 但是他还在阵列当中 数据会绕过 存到其他 盘上 但他还是阵列中的一员

他虽然有故障 但他还能组成阵列 没有他 的话 那 数据传输 方式 会有变化 如果是备份模式 那么 那怪故障盘的 资料也就没了

如果剩下两块以上 硬盘 你还可以在重新组一下

另外问一下 你如何判断 那块硬盘坏了 就因为他的黄灯亮了吗 ?硬盘这东西 一般 不会坏

除非 硬伤 或正在使用中 电线 数据线接触不良 造成硬件烧坏

不过一般没事

什么原因容易导致RAID磁盘阵列信息丢失

怎么排除服务器中RAID5故障

 但是,对HP的一些老服务器(如HP LH6000)数据的恢复与新服务器(如HP ProLian系列服务器)的数据恢复是不同的。所以不同的服务器对RAID 5故障的处理也是不同的。曾接触过两台服务器因意外断电而造成的RAID 5阵列卡数据故障,由于采用了不同的策略而解决了问题。

 故障修复

 一台是HP LH6000的服务器,4块18GB的硬盘做成RAID 5磁盘阵列,其阵列卡是NetRaid;另一台是HP ProLian ML370服务器,4块146GB的硬盘做成RAID 5磁盘阵列,其阵列卡是Smart Array 642并带有热备份硬盘(Hot Spare)。两者操作系统都为Window 2000,数据库是Server 2000。

 HP LH6000的故障如下: 一块硬盘红灯闪亮,机器还在正常运行,但没有多久,系统就不能正常运行,这时才发现另一块硬盘的红灯也在闪亮。

 解决办法如下:

 1启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。查看阵列信息,发现硬盘状态为Failed,运用修改配置将一硬盘强行设置成OnLine。重新启动服务器,在进入系统前的硬件自检时无效,启动失败。

 2启动服务器,自检至阵列时按Ctrl+M进入NetRaid管理程序。选择磁盘阵列,将原来OnLine挂起来的硬盘手工Fail掉,然后再把另一块Failed的硬盘手工设置成OnLine,重新启动服务器就可以进入系统了。

 3查看系统及数据库都运行正常后,再进阵列配置工具把Failed的硬盘手工设置成Rebuild,100%完成重建后再重启服务器,所有的阵列及系统都恢复原状了。

 另一台运行ERP系统的服务器(HP ProLiant ML370),由4块146GB热插拔硬盘通过RAID卡(Smart array阵列卡)配置成一台具有RAID 5级的磁盘阵列。其中一块硬盘在运行过程中突然出现故障。服务器RAID 5自动启用热备份硬盘(Hot Spare),对损坏硬盘进行逻辑替代。整个硬盘的数据访问任务仍然完整地运行在原来的读写进程序列中,应用程序和数据库没有发生影响。

 通过HP自带的ACU工具查看硬盘状态进行检查,发现红灯示警的硬盘处于脱机状态。如果HP ProLiant服务器中的Raid 5有两块硬盘出现亮红灯时,表明系统已经崩溃,数据库也就不能访问,但系统不会自动关机。当第二块硬盘亮红灯后,用常规的手段是不能恢复数据的,只有付费找专业的第三方数据恢复公司恢复数据。

 因此,对惠普老型号HP LH6000系列服务器来说,阵列的设计方面与现在HP ProLiant系列服务器的阵列有很多不同。就操作方法看,HP LH6000服务器的阵列操作方法有很多可选项,包括阵列失败后可以重新删除阵列并重建等,初始化也是手工选择的。但是HP ProLiant系列服务器阵列的初始化是在配置阵列后自动在后台执行的,所以ProLiant系列服务器在阵列出错后是不能重配阵列的。

 HP LH6000服务器会因其他意外的原因导致阵列中的磁盘出现掉线现象,可让维护人员手工选择用Online或Offline、Rebuild等来恢复数据。但是现在的HP ProLiant系列服务器在阵列中不会再出现像老的服务器那样有磁盘掉线的现象,所以硬盘亮红灯的时候,这块硬盘基本上是损坏了需要更换。当然可以选择热插拔硬盘来重建(Rebuild),看硬盘还能不能再用一段时间。

 做好技术后备

 从以上两个例子可以看出,同一品牌、不同系列的服务器因其内含技术的不同,其Raid 5磁盘故障的排除也是不同的。但经过重建(Rebuild)数据后,数据被拯救了,从中可以得出以下经验:

 我们认为任何先进的技术手段都不是万无一失的。如果要确保数据安全,就一定要做好备份工作,最好每天做一次数据库的异地备份。至少备用一块新硬盘。需要指出的是,加入阵列的硬盘必须大于或等于故障硬盘的容量。

 如果条件允许,推荐“RAID 5+热备盘”的阵列创建方案。这样在数据丢失前,我们有两次更换硬盘的机会。对于一般的应用,只用RAID 5即可,可以同时提供数据的存取性能、可靠性和最大的磁盘空间。

 管理员必须经常观察阵列的状态,包括查看磁盘阵列的**警告灯和管理软件里的驱动器状态。出现故障,及时排除。无论是什么级别的阵列,在排除故障前,都应做好数据备份。

;

Raid磁盘阵列数据恢复原理

RAID数据丢失的常见原因有:

1、RAID阵列卡或服务器出现故障;

2、磁盘物理故障,如:电路板坏、磁头损坏、盘面坏、坏扇区、固件坏等;

3、突然停电;

4、拔插硬盘将顺序弄错;

5、重新配置RAID阵列信息等。

硬盘阵列失败问题求高手解决。。。

·· raid磁盘阵列为服务器提供安全的、可靠的、可申缩的外部存储空间。但是多数的服务器使用者对raid并不是十分了解再加上服务器的广告上都太过强调了raid阵列的错容功能,使得很多服务器的使用者受到一种“raid不会出现故障”的错误引导。因此在服务器的使用过程中忽视了raid磁盘阵列的潜在风险,对服务器数据的备份或者应急预案不足,一旦服务器出现故障将为企业带来极大的影响。Raid磁盘阵列出现故障的原因通常可以归结为如下几点:

Raid控制器出现故障导致raid失效

突然断电导致raid信息故障

Raid5一块硬盘出错,系统管理员未及时更换硬盘的情况下另一块硬盘出错导致raid5失效。

下面介绍服务器磁盘阵列中raid1、raid0、raid5三种raid形式出现故障时的数据恢复思路和方法。

1raid1阵列数据恢复

·· Raid1是所有raid阵列中最为简单的一种阵列形式,raid1中两块硬盘互为镜像,所有数据都是完全一样的。如果因为raid控制器故障或者raid信息出错导致raid1磁盘阵列数据无法访问,只需要将两块硬盘中的其中一块硬盘从服务器上拆卸下来后作为单独的硬盘挂载到计算机上即可读取数据。

·· 如果raid1中其中一块硬盘出现故障时是不会影响服务器的正常运行的,此时需要将故障硬盘更换为正常硬盘即可。如果服务器一块硬盘故障时未能及时更换硬盘另一块硬盘也出现故障,则raid1磁盘阵列失效。此时想要进行数据恢复需要利用后出现故障的那一块硬盘进行数据恢复即可。

2raid0磁盘阵列数据恢复思路

·· Raid0是所有磁盘阵列中最脆弱的磁盘阵列形式,raid0磁盘阵列没有任何冗余性能,阵列中只要有一块硬盘故障则服务器数据就会丢失,所以是一个风险极大的阵列形式。通过下图可以看出,raid0的数据是分布到每一块磁盘上的,如果服务器中任何一块硬盘出现故障都会导致服务器的数据不完整。

·· 对于raid0磁盘阵列的数据恢复要求数据恢复工程师对阵列中的所有数据进行重组,又由于raid0阵列已不可用,所以只能将硬盘从raid控制器中取出来作为单块硬盘进行分析和数据恢复。

如上图所示,对于单块硬盘1来说,其中的数据为A/E/I/M,硬盘2中的数据为B/F/J/N,都只是部分数据,只有把阵列中的所有硬盘数据按照A/B/C/D/E/F/G/H····这样的顺序拼接好,才能真正恢复raid0阵列中的数据。

·· 那么应该怎么按照顺序拼接这raid0阵列中的所有硬盘数据呢,这里需要注意两个因素,一个是raid0磁盘阵列中每个数据块的大小,也就是A或者B这些数据块所占用的扇区数;另一个因素是raid0阵列中的硬盘排列顺序,也就是说需要确定哪一块硬盘是阵列中的第一块硬盘,哪一块是第二块、第三块····

·· 以上图中的raid0磁盘阵列为例,我们假设数据块的大小为16个扇区,硬盘的顺序就以图中的为例,那么我们在进行数据恢复时只需要在硬盘1中提取0~15扇区的信息,再到硬盘2中提取0~15扇区信息,再到硬盘3中提取0~15个扇区的信息,再到硬盘4中提取0~15个扇区的信息,再返回到硬盘1中提取16~31扇区的信息····以此类推,就可以将这个raid0阵列里的所有数据提取出来了。

3raid5磁盘阵列数据恢复原理

·· Raid5阵列中数据的分布与raid0阵列类似,与之不同的是raid5中每个平行的数据块中总有一个数据块是校验块,如下图中的p1/p2/p3/p4。Raid5支持在一块硬盘掉线的情况下保证数据的正常访问,但是如果有两块或者两块以上的硬盘同时离线,阵列便会失效,需要对磁盘阵列进行数据重组了。Raid5的数据重组方式与raid0也是相同的,只需要将硬盘中的数据按照顺序拼接好即可

·· 由于raid5阵列中的每一块硬盘中都有校验信息,所以分析raid5阵列时需要比raid0阵列多分析一个校验块的位置和方向。也就是说raid5阵列分析有3个因素,分别是硬盘排列顺序、每个数据块所占的扇区数、阵列中每个数据块的大小。

·· 以上图中的raid5阵列为例,假设该raid5阵列的数据块大小为32个扇区,盘序如图所示,那么在提取数据时只需要按照从1~4的顺序分别提取0~31扇区的信息(硬盘4中0~31扇区的信息为校验块,跳过不取),然后再返回到硬盘1中提取32~63扇区信息,以此类推,即可把所有提取出来的数据组成一个完整的raid5阵列镜像文件。

板载RAID控制器不稳定,而且不建议使用RAID0模式,极容易RAID掉线进入不了系统,你这里红色failed指的应该就是RAID0的状态是失效的所以进不去。至于有时候能进系统涉及两个问题:1、你的板载RAID控制器不稳定,尝试升级固件 2、使用的笔记本硬盘响应时间太长造成RAID控制器误为磁盘故障或者丢失,然后RAID控制器会把该磁盘踢掉,raid0降级直接failed掉。为什么不直接使用单盘模式呢。

 
友情链接
鄂ICP备19019357号-22