RAID-6 : 두 개의 데드 드라이브를 동시에 또는 한 번에 하나씩 교체하는 것이 더 좋습니까?


21

3 개의 문제가있는 드라이브가있는 16 개의 드라이브 RAID-6이 있습니다. 두 명은 이미 사망했으며 세 번째는 SMART 경고를 제공합니다. (어떻게 나쁜 상황에 처했는지는 신경 쓰지 마십시오.)

분명히 우리는 여전히 작동하는 드라이브보다 죽은 드라이브를 교체하려고하지만 다음과 같이하는 것이 좋습니다.

  1. 하나의 죽은 드라이브를 교체하고 RAID를 재 구축 한 다음 다른 드라이브를 교체하고 다시 재 구축하십시오. 또는

  2. 두 드라이브를 한 번에 교체하고 동시에 두 드라이브를 모두 재 구축 할 수 있습니까?

다시 말해, 하나 또는 두 개의 드라이브를 다시 도입하여 중복 상태로 빠르게 돌아갈 수 있습니까? 두 개의 드라이브를 병렬로 재 구축하면 재 구축 프로세스가 느려 집니까?

중요한 경우 컨트롤러는 3ware 9650SE-16ML입니다.


10
당신이 얻을 수있는 모든 것을 교차하고 좋아하는 $ 신에게 큰 기부금을 보내십시오!
user9517은

1
이것에 관한 질문 하나만해도 될까요? 이 어레이에서 디스크의 정확한 제조사 및 모델을 알려주십시오. 내 의혹이 맞다면이 질문이 향후 사용자가 특정 질문을하는 데 유용한 참조 점이 될 수 있습니다. 고맙습니다.
Chopper3

8
@Warren-AIEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEEE! 그들은 그것을 해제? 나쁜 친구 Juju! 이번에는 너무 늦었지만 일반적으로 드라이브를 종료하면 (특히 오래된 드라이브 인 경우 오랜 시간 동안 드라이브를 사용하는 경우) 스핀 업에 오류가 발생할 수 있습니다 (예 : 드라이브) "지금 너무 튀김된다
voretaq7

2
@ voretaq7 : 한 번의 가동 시간과 연속 사용 후 종료하여 MSA-20 박스에서 모든 디스크를 지옥으로 보냈습니다. 다시는 그렇게하지 않을 것이다 :-)
karatedog

1
이제 어레이가 가동되어 재 구축되므로 관심있는 사람을 위해 정확한 모델을 얻을 수 있습니다. 원래 하드 드라이브는 ST31000340NS였으며 이는 Chopper3가 요청한 서버 등급 버전임을 의미합니다. 이것들은 실패 나 다른 것으로 악명 높은가? (새로운 것은 ST31000524NS입니다.)
Warren Young

답변:


27

!!!!! 하나 !!!!!

한 번에 하나씩, 진지한 친구, 다른 방법으로는 할 생각하지 마십시오.

그 밖의 모든 것이 전체 시스템 복원 기술을 테스트합니다.


3
이 답변에 추가 할 두 가지 항목은 (1) 원하는대로 신의 기도 와 (2) 모든 것을 안전한 상태로 되 돌린 후 모니터링 합니다 (미래에 드라이브가 고장 나면 알 수 있습니다. . 당신은 2.5 실패를하기 전에 문제가 선택적으로 당신은 또한 미래를위한 배열에 핫 스페어를 구성 할 수 있습니다.
voretaq7

3
또는 RAID 10 사용 </ stockanswer>
Chopper3

1
다시 :기도 , 의견이 없습니다. :) 다시 : 모니터링 , 나는 몇 년 동안 그것을 옹호했습니다; 아마도 이것은 누군가의 밑에 불을 붙일 것입니다. 다시 : RAID-10 , 입찰 시장에서 너무 많은 데이터; 3TB 디스크가 나왔을 때 중복성을 3 배로하지 않았으며 디스크 수를 1/3로 줄였습니다. 한숨. 다시 : 핫 스페어 , 이제 드라이브가 충분히 커질 수 있지만이 특정 서버는 16 개의 드라이브 엔클로저에서 16 개의 드라이브였습니다. . 24 드라이브 시스템으로가는 것은 효과가 없었을 것입니다. 이전 참조. :)
Warren Young

2
드라이브가 이미 고장난 경우 드라이브를 유지할 이유가 없습니다. 차라리 두 개의 연속 재 구축이 단일 드라이브보다 다른 드라이브에 더 많은 스트레스를 줄 것으로 예상됩니다.
Simon Richter

1
+1, 이것. 두 번의 연속 재 구축으로 스트레스를 더 많이 받고 두 번째 드라이브를 모두 완료하기 전에 세 번째 드라이브에 장애가 발생할 가능성이 높지만 재 구축 속도도 빨라지고 두 번째 디스크를 재 구축하는 동안 한계 드라이브에 장애가 발생하더라도 온라인 상태를 유지합니다. 따라서 내결함성 상태로가는 가장 빠르고 안전한 방법은 한 번에 하나씩입니다.
Joel Coel

14

최근에 백업 한 것이 있습니까? 그렇지 않다면 합리적인 시간에 구할 수 있다고 생각하십니까?

솔직히 다시 빌드하는 동안 다른 드라이브보다 나쁜 드라이브를 오프라인으로 트립하는 것에 대해 더 걱정하고 싶습니다. 이미 SMART 오류가 발생하면 절반 이상입니다.

내 제안은 백업을 확인한 다음 한 번에 하나의 드라이브를 다시 작성하여 SMART 오류가 발생하는 것을 대체 할 수있는 상태로 복구하려고 시도합니다 (죽은 드라이브가 먼저, 소프트 오류가 마지막 임).

백업이없는 경우 이는 불량입니다. 백업하면 재 구축을 시도 할 때 한계가있는 드라이브를 실패한 것으로 표시하기에 충분한 소프트 오류가 발생할 수 있습니다.


2
이 어레이의 대부분 또는 모든 데이터는 일종의 캐시이므로 느린 링크를 통해 테라 바이트 단위의 데이터를 반복적으로 가져올 필요가 없습니다. 이 캐시 데이터는 몇 달에 한 번 다시 다운로드하거나 (1 회) 다른 어레이에서 복사 할 수있는 사이트로 배송하여 교체 할 수 있습니다. 따라서 백업은 문제가되지 않습니다. 어레이를 저장함으로써 방지하려는 것은 서버를 서비스 저장소로 배송하고 어레이를 다시 채우고 다시 배송하는 데 며칠에서 몇 주가 걸리는 다운 타임입니다.
워렌 영

이 경우 @ chopper3가 말한 것은 대단한 것입니다. The Law of The Land : 한 번에 하나의 드라이브를 다시 빌드하고 정말로 읽기 하드를 사용하여 여분의 읽기로드로 한계 드라이브를 오프라인으로 트립하지 않도록하십시오.
voretaq7

휴-들어서 반갑습니다.
Chopper3

0

"한 번에 하나의 디스크"로 바꾸는 데 아무런 의미가 없습니다.

RAID가 두 디스크를 동시에 "리 실버 링 (resilvering)"할 수있는 경우 ( 어쨌든 실패한 경우) 전체 RAID가 최대 2 개의 오류를 더 빨리 유지할 수있는 능력 만 확보 할 수 있습니다 .


-1

내 0.02. $

서버가 이미 오프라인 상태이므로 실패한 드라이브에서 ddrescue를 실행하여 다른 정상 드라이브에 복제하십시오.

그런 다음 새 정상 드라이브를 어레이에 넣으십시오. 복제가 성공하면 2 번의 재 구축 동안 드라이브가 고장날 위험이 없습니다.


하드웨어 RAID 컨트롤러이며 개별 디스크는 주소를 지정할 수 없습니다.
Chopper3
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.