RAID 5 구성에서 드라이브 오류를 복구하는 방법은 무엇입니까?


15

오늘 아침 데이터베이스 서버에서 드라이브가 고장났습니다. 드라이브 배열 (디스크 3 개)은 RAID 5 구성으로 설정됩니다.

드라이브 교체를 기다리는 동안 복구 전략을 준비하고 있습니다. 매우 느리지 만 사용자는 시스템에서 계속 작업하고 있습니다 (왜 그런지 모르겠습니까 ??).

새 드라이브는 어떻게 설치합니까?이 드라이브의 데이터는 패리티에서 자동으로 다시 작성됩니까? 아니면 따라야하는 다른 프로세스가 있습니까?

편집 : 하드웨어 RAID 컨트롤러입니다. (지금까지 답변 해 주셔서 감사합니다.)


4
그건 그렇고, 중요한 서버에서 드라이브가 고장 나면 어떻게 해야할지 결정하는 시간은 중요한 서버 에서 드라이브가 고장 나기 전에 입니다.
David Schwartz

답변:


15

추가 CPU 및 I / O와 관련된 누락 된 데이터를 재구성해야하기 때문에 시스템이 매우 느리게 실행됩니다.

RAID-5 구성에 디스크가 없는 경우 복구 전략없습니다 . 다른 디스크가 다운 되면 데이터가 손실됩니다 . 당일 긴급 배송 업체가 제공하는 제조업체의 보증이 적용되는 호환 가능한 부품을 얻을 수있는 가장 가까운 공급 업체를 찾아 가십시오. 어레이를 구입 한 공급 업체가 이미 부품을 가져 오는 과정에있는 경우 두 부품을 모두 확보하고 다른 부품을 예비 부품으로 보관하십시오.

프로덕션 시스템에 RAID-5를 사용하는 경우 예비 디스크를 어레이에 핫 스페어로 남겨 두어야합니다.

추가됨-로그가 별도의 볼륨 (실제로 별도의 디스크)에없는 경우 단일 미러 쌍이라도 별도의 디스크 세트로 옮깁니다. 로그 볼륨에 대한 경합이 성능에 불균형 적으로 나쁜 영향을 미치므로 데이터베이스에 상당한로드가있는 경우 성능이 향상됩니다.

이것이 가능하면 다음을 수행하여 데이터베이스를보다 강력하게 만들 수도 있습니다.

  1. 데이터베이스를 종료하십시오.
  2. 데이터베이스를 백업하십시오.
  3. 로그를 물리적으로 분리 된 디스크 세트로 이동하십시오 (로그가 이동 된 위치를 알 수 있도록 데이터베이스를 재구성하십시오).
  4. 데이터베이스 및 애플리케이션을 다시 시작하십시오.

별도의 볼륨에 로그가있는 경우 디스크 장애가 로그를 손상시키지 않는 경우에만 백업에서 복원하고 롤 포워드 할 수 있습니다 . 데이터베이스 로그는 다음과 같은 이유로 별도의 디스크 볼륨에 있어야합니다.

  • 로그 사용 패턴은 주로 순차적이며 파일 끝에 로그 항목을 추가합니다 (파일은 실제로 링 버퍼 임). 이는 디스크 헤드 탐색 활동이 적기 때문에 많은 수의 로그 항목을 빠르게 기록 할 수 있음을 의미합니다.

  • 트랜잭션 테이블 및 인덱스와 같이 많은 랜덤 액세스 워크로드와 물리적 디스크를 공유하는 경우 헤드 탐색 활동이 순차적 쓰기를 방해하므로 불균형 적으로 느려집니다.

  • 별도의 볼륨에 로그를 두는 것은 거의 항상 성능상의 승리이며 로그가 상당히 많은 워크로드를 지원하기 위해서는 단일 미러링 쌍만 필요합니다. 이는 하드웨어가 매우 저렴하므로 성능과 안정성이 크게 향상되는 비용이 적다는 것을 의미합니다.

  • 데이터 배열이 중단되면 로그가 손실되지 않습니다. 적절한 백업 전략이있는 경우 백업에서 복원하고 로그에서 롤 포워드 할 수 있습니다. 이는 단일 장애 지점이 아닌 전체 어레이가 서버에서 다운 될 수 있음을 의미합니다. 데이터 손실을 유발하려면 로그와 데이터 배열이 동시에 실패해야합니다.


시스템이 왜 느리게 작동하는지 설명하는 답변에 감사드립니다.
Philip Fourie

에 딱 맞다. 교체 드라이브를 제자리에 놓을 때까지 종료하는 것이 좋습니다. Nigel이 말했듯이 복구 전략은 없습니다. 다른 드라이브를 잃어 버리면 모두 풉니 다.
Stu Thompson

안녕하십니까, 시간을내어 귀하의 전문 지식을 공유해 주셔서 감사합니다. 실제로 훌륭한 조언입니다. 복구 결과에 대해서는 나중에 다시 설명하겠습니다.
Philip Fourie

5

1) 백업.

현재 데이터가 손실되지 않았습니다. 백업이 최신 백업이 아닌 경우

2) 설명서를 읽고 공급 업체 등에 문의하십시오.

RAID 시스템마다 디스크 교체 단계가 다르므로 잘못 수행하면 전체 어레이가 손상 될 위험이 있습니다. 어떤 종류의 RAID 하드웨어 / 소프트웨어를 모르더라도 필요한 단계 만 추측 할 수 있습니다.

또한 성능이 저하 된 상태 (즉, 하나의 디스크 작동 불능)의 RAID 5가 읽기 성능이 끔찍하기 때문에 성능이 저하됩니다. 패리티가 어떻게 저장되고 어떤 디스크가 죽었는지에 따라 얼마나 끔찍한가가 결정되지만, "좋은"소식은 한 디스크가 없어도 성능이 저하된다는 것은 알려진 문제이며 공황을 유발하지 않습니다.


4

먼저 사용중인 하드웨어 / 소프트웨어 매뉴얼을 읽으십시오-고장 복구 섹션 :)

디스크를 교체하고 어레이를 재 구축하는 간단한 문제입니다.

이 경우 가장 중요한 점은 다른 디스크에 장애가 발생하면 데이터가 손실 될 수 있으므로 가능한 빨리 디스크를 교체해야한다는 것입니다. 또한 고장의 원인을 해결해야합니다. 디스크가 오래 되었기 때문입니까? 다른 것도 교체해야합니까? 아니면 전원 서지, 열 또는 진동 때문입니까?


1
아마도 데이터가 손실됩니까? 배열의 모든 데이터가 가장 손실됩니다! 교도소에 가십시오. (물론 백업은 제외하고)
Stu Thompson

1

RAID5를 이해하는 한, 고장난 드라이브를 교체하면 다른 두 드라이브에 저장된 정보로부터 자동으로 재 구축됩니다. 새 드라이브를 '핫스왑'할 수 있는지 여부는 시스템에 따라 다릅니다. 먼저 전원을 꺼야 할 수도 있습니다. 어느 쪽이든, 상대적으로 저렴한 드라이브 비용과 데이터의 중요성 (먼저 RAID5를 사용하기로 한 결정에 따라 결정됨)을 고려할 때 실제로는 드로어에 앉아 여분의 드라이브를 가져와야합니다. .

나는 최근에 나 자신을위한 새로운 개발 PC를 구축했고, RAID5에서 주요 데이터 드라이브를 설정했다. 나는 필요 이상으로 하나 이상의 드라이브를 주문하여 비상 사태에 대비할 수있는 여분의 장비를 준비했습니다.

이제 당신은 질문을했습니다. 나는 그 주제에 대해 더 잘 읽을 것이라고 생각합니다.


작은 데이터 볼륨의 경우 일반적으로 작은 RAID-5보다 순차적 액세스 속도가 더 우수하므로 미러 쌍이 더 좋습니다. 핫 스왑을 원한다면 scsi4me.com과 같은 어딘가에있는 핫 스왑 베이 시스템을 살펴보십시오
ConcernedOfTunbridgeWells

0

전적으로 시스템에 따라 다릅니다. 매뉴얼은 무엇을 말합니까? 하드웨어가 컨트롤러에서 드라이브 베이로 새 드라이브 핫 플러그를 완전히 지원합니까? 최근 백업이 있습니까?


0

NXC의 게시물은 그것을 훌륭하게 요약합니다. 두 번째 오류가 발생하기 전에 결함이있는 드라이브를 교체하지 않는 경우에도 전문 복구 서비스를 통해 거의 모든 것을 복구 할 수 있습니다 (때로는 모든 것). 데이터는 여전히 디스크에 있으며 고장난 디스크는 일반적으로 적절한 장비를 갖춘 전문 실험실에서 다시 살아날 수 있습니다. 그러나이 서비스의 가격은 상당히 높습니다. 여분의 디스크와 적절한 백업 (NXC의 제안에 따라)을 갖는 것이 미래에가는 길입니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.