“Raid 5 + spare”또는“Raid 6”을 사용해야합니까?


12

"Raid 5 + Spare"란 무엇입니까 ( 사용자 매뉴얼, 섹션 4.17.2, P.54 에서 발췌 ) :

RAID5 + 예비 : RAID 5+ 예비는 RAID 5 어레이이며 디스크가 고장 나자마자 하나의 디스크를 예비 디스크로 사용하여 시스템을 재 구축합니다 (그림 79). 최소 4 개의 디스크가 필요합니다. 하나의 물리 디스크에 장애가 발생하면 패리티 블록에서 데이터를 읽으므로 데이터를 계속 사용할 수 있습니다. 장애가 발생한 디스크의 데이터는 핫 스페어 디스크에 재구성됩니다. 고장난 디스크를 교체하면 교체가 새로운 핫 스페어가됩니다. 단일 디스크 장애의 경우 데이터가 손실되지 않지만 시스템이 핫 스페어로 데이터를 재구성하기 전에 두 번째 디스크가 실패하면 어레이의 모든 데이터가 손실됩니다.


"Raid 6"이란 무엇입니까 ( 사용자 설명서, 섹션 4.17.2, P.54 에서 발췌 ) :

RAID6 : RAID 6에서는 데이터가 모든 디스크 (최소 4 개)에 걸쳐 스트라이핑되고 각 데이터 블록 (그림 80의 p 및 q)에 대한 2 개의 패리티 블록이 동일한 스트라이프에 기록됩니다. 하나의 물리 디스크에 장애가 발생하면 장애가 발생한 디스크의 데이터를 교체 디스크에 재 구축 할 수 있습니다. 이 RAID 모드는 데이터 손실없이 최대 2 개의 디스크 오류를 지원할 수 있습니다. RAID 6은 장애가 발생한 디스크에서 데이터를보다 빠르게 재구성합니다.


"Raid 5 + spare"와 "Raid 6"은 모두 비슷합니다 ... 차이점을 알 수 없습니다.

"Raid 5 + Spare"는 언제 최적입니까?

"Raid 6"은 언제 최적일까요?

매뉴얼은 별 5 개 등급으로 다른 공격대를 무너 뜨립니다. "Raid 5 + Spare"는 별 4 개만, "Raid 6"은 별 5 개를 얻습니다. 맹목적으로 매뉴얼을 믿어야한다면 "Raid 6"이 항상 더 낫다는 결론을 내릴 것입니다. "Raid 6"이 항상 더 낫습니까?


1
ServerFault 는 이에 대해 좋은 토론을합니다.
브라이언

1
당신이 무엇을 하든지, 당신의 mobo와 함께 제공되는 온보드 소프트 컨트롤러가 아닌, 레이드 컨트롤러 만 습격하십시오. 당신의 mobo가 나가면, 당신은 문제를 요구하고 있습니다.
sound2man

레이드는 하드웨어 컨트롤러에 의해 다운되고 있습니다. (Lol 저는 소프트웨어 레이드 컨트롤러에 대해 너무 많은 것을 들었습니다).
Trevor Boyd Smith

답변:


17

한마디로 :

  • 안전이 주요 관심사 인 경우 동시에 실패하는 두 개의 드라이브에서 살아남을 수 있으므로 RAID6을 사용하십시오. R5 + 예비 배열에서 드라이브에 장애가 발생하면 예비 드라이브의 속도가 빨라질 때까지 다른 장애로부터 안전하지 않습니다. 큰 드라이브에서는 시간이 오래 걸릴 수 있습니다 (그리고 전원이 꺼진 드라이브에 대해서는 들어 본 적이 없습니다) 당신의 여분과 같은 연령대가 마지막으로 요구 될 때 회전하지 못합니다).

  • 성능이 왕이 경우, 5 이동 + 예비 배열이 저하 된 상태에 있지 않을 때 쓰기 성능이 더 좋을 것 같은 - R5 및 R6 사이의 성능 차이가 R5 및 다른 솔루션과의 차이보다 훨씬 작은하지만 경우에 당신이 있습니다 좋은 컨트롤러 -calc-then-write-then-write (-then-write) "는 매우 저렴한 컨트롤러 및 소프트웨어 RAID가 수행 할 수있는 작업입니다.

편집 : 나는 잠재적으로 중요한 점을 처음 놓쳤다.

  • 전력 소비가 중요한 경우 , 컨트롤러가 예비 드라이브의 전원을 필요할 때까지 끄는 경우 R5 + 예비는 추가 이점 있습니다.

가장 잘 쓰여진 / 간결한. (각 글 머리 기호의 처음 두 단어에 분명한 장단점이 있습니다 ... 매우 좋습니다).
Trevor Boyd Smith

하나의 추가 드라이브의 전력 소비 가 데이터 센터 / 서버 실 등의 다른 모든 것에 비해 실제로 "관심"이 될 때가 궁금합니다.
Warren

단일 시스템의 단일 드라이브. 그러나 랙 당 X-amps를 얻고 초과분에 대해 많은 돈을 지불하는 콜로에서 (또는 초과분은 단순히 허용되지 않습니다. 때로는 넘어 가면 어두워집니다) 눈에.니다. "소비"된 전력도 이중 열악합니다. 소음과 열로 변환되어 열을 멀리 이동시키는 데 더 많은 전력이 필요합니다. 그리고 전체 케이지 또는 더 큰 키트 세트의 경우 계산 장치 당 추가 드라이브의 총 소비량은 곧 까다로운 회계사가 알아 차릴 수있는 것으로 이어집니다.
David Spillett

7

RAID 5 + 핫 스페어 :

  • RAID 6보다 동일한 컨트롤러 하드웨어 성능 향상
  • 동시에 2 디스크를 잃을 수 없습니다 . 디스크를 잃어 버리면 중복성없는 재 구축 시간 (핫 스페어 사용)이 있습니다 . 이 시점에서 실패한 것은 완전한 손실을 초래합니다 ( 좋은 데이터 복구 회사에 모든 것을 보내지 않고 실제로 $$$$ 지불)

RAID 6 :

  • RAID 5보다 성능이 저하됨 (컨트롤러에 따라 다르지만 거의 차이가 없을 수 있음)
  • 동시에 2 개의 디스크를 잃을 수 있습니다

RAID 5 또는 6의 경우 동일한 프로덕션 실행이 아닌 디스크를 사용하는 데주의해야합니다. 재 구축에 대한 단일 실패 후 스트레스 증가로 인해 다음 디스크가 실패 할 수 있습니다. 동일한 실행의 디스크는 정확히 동일한 펌웨어를 가지고 있으며 아마도 매우 유사한 물리적 속성을 가지고 있습니다.

편집 : 무엇을 선택

(또한 서버의 성능 요구 사항과 허용 가능한 위험에 따라 다릅니다.)

서버 환경이 하드웨어 (콜로, 기후 등)에 매우 좋은 경우 RAID5 + 핫 스페어를 사용해도됩니다.

환경에서 짧은 시간 (진동, 습도, 먼지) 내에 둘 이상의 디스크가 고장날 가능성이 높으면 RAID 6으로 이동하십시오.

또한 항상 적절한 백업 및 테스트 복구를 수행하십시오.

편집 2 : 알맞은 RAID 컨트롤러에는 스크러빙 이있어 모든 섹터를 주기적으로 확인합니다.


"적절한 백업 및 테스트 복구"를 위해 +1 이것이 RAID 레벨에 대해 걱정하기 전에 모든 사람들이 가져야 할 첫 번째 것입니다.
워렌

3

RAID5는 하나의 패리티 스트라이프를 사용합니다. Reed Solomon 오류 수정을 계산하고 RAID6에 대한 두 개의 스트라이프와 RAID5에 대한 두 개의 스트라이프를 작성해야합니다. RAID5는 RAID10 비용으로 인해 스토리지가 큰 강력한 데이터베이스 응용 프로그램에 사용됩니다. RAID5 비용은 디스크 가용성이 67 %에서 94 % (RAID10이 50 % 인 경우) (스토리지 비용이 훨씬 높음) 다양합니다. RAID6는 회전 대기 시간으로 인해 읽기 지연 시간이 매우 적은 반면 RAID6는 쓰기 시간이 25 ~ 31 % 더 느립니다. 에러 정정의 계산 및 패리티 비트의 추가 기록.

드라이브에 MTBF (mean time between failure)를 사용하면 두 드라이브가 차례로 또는 동시에 실패하는 확률은 약 (0.1% x 0.1%)*12또는 0.001 x 0.001 * 12; 1000 개의 드라이브를 실행하는 경우 매년 ~ 1.2 개의 드라이브가 손실됩니다. 약 8.3 년마다 두 개의 드라이브가 하나씩 고장납니다. 이제 재 구축 중 드라이브에 과부하가 발생하여 드라이브 장애가 Poisson 분포가 아니기 때문에이 기간 동안 두 번째 드라이브 장애가 발생할 가능성이 더 높으며이 분포는 감마 분포에 더 가깝습니다. 실패가 발생합니다.

결론적으로, RAID5의 성능은 쓰기 및 DB 응용 프로그램의 RAID6보다 훨씬 우수합니다. 웹 서버와 같이 대부분 읽은 응용 프로그램의 경우 아무런 차이가 없으므로 RAID6을 사용해야합니다. RAID10보다 RAID5를 사용하면 비용이 많이 듭니다. 오버 헤드를 감당할 수 있으면 디스크를 많이 사용하는 응용 프로그램에 RAID10을 사용하십시오. RAID10은 항상 더 나은 성능을 발휘합니다.

가장 큰 손실은 RAID가 백업이 아니라 중복성을 제공하여 가동 중지 시간을 제한하는 방법입니다. 데이터가 중요한 경우 데이터를 백업하고 복구 프로세스를 테스트해야합니다.

10 2TB SAS 드라이브 중 하나의 RAID 어레이에 장애가 발생하면 복구 비용이 수천 달러에 달하며 복구에 몇 주가 걸릴 수 있습니다.

모든 RAID 어레이가 결국 실패합니다!


1

데이터 무결성 관점에서 말하면 그렇습니다. 시스템에 심각한 물리적 외상을 두 개씩 잃는 경우는 드물지만 두 개의 드라이브를 안전하게 잃을 수 있습니다 .

재정적으로는 많지 않습니다. 핫 스페어는 필요할 때까지 전원을 끌 수 있으므로 전원을 사용하지 않고 마모가 발생하지 않습니다.

항상 그렇듯이 RAID는 적절한 오프 사이트 백업 계획을 대체하지 않습니다.


1

10을 고려 했습니까? RAID 6에 사용할 수있는 디스크가 충분하면 10 볼륨을 수행 할 수 있습니다. 대부분의 경우 10은 일부 디스크 공간을 희생하여 더 빠르고 더 중복됩니다.


10은 4 개의 디스크 만 지원합니다. raid 10은 옵션 IMO가 아닙니다.
Trevor Boyd Smith

1
@Trevor Raid 10은 짝수의 디스크> = 4를 지원합니다. 6 번 공격을 할 수 있다면 10 번 공격을 할 수 있습니다.
Joel Coehoorn

1

이 답변은 이론적 인 드라이브 성능만을 기반으로하기 때문에 잘못된 것 같습니다. 1GB의 캐시가있는 RAID 컨트롤러를 사용하는 경우 쓰기 (일반적으로 일반로드 상태-대량의 비정규 고부하 시나리오가 아님)는 사용자 또는 응용 프로그램의 관점에서 즉각적으로 나타납니다. 메모리로 이동 한 다음 '실제'쓰기는 드라이브 성능에서 발생합니다.

그러나 동일한 데이터가 최근 또는 습관적으로 이미로드되지 않은 경우 읽기는 '가짜'(캐시와 함께 속도가 빨라짐) 일 수 없습니다. RAID 6은 읽기에 더 적합하고 더 관대합니다 (2 대 1 드라이브). Raid 5는 쓰기 속도가 느리고 재구성 할 때 속도가 느립니다.

따라서 RAID 5는 실제 쓰기 속도가 느리지 만 사용자 / 응용 프로그램의 관점에서 쓰기가 메모리에서 발생하는 우수한 RAID 컨트롤러로 숨겨집니다. 그러나 Raid 5는 RAID 6보다 읽기 속도가 느리고 데이터가 이미로드되었거나 알고리즘이 반복 된 읽기 레코드를 유지하지 않으면 컨트롤러를 사용하여 개선되지 않습니다. 실제 생활에서-공습 6이 이깁니다.

결론적으로 Raid 5 쓰기는 느리지 만 좋은 컨트롤러로 숨겨져 있으며 RAID 5 또는 6은 기본적으로 쓰기의 '인식 된'성능과 동일합니다 (일부 예외가 있음). 그러나 Raid 6은 더 빠르게 읽을 수 있으며 컨트롤러는 실제 작업 부하에서 읽기 성능을 향상시키는 데 도움이되지 않습니다. 이제 Raid 6은 두 번의 실패가 발생할 수 있으며 Raid 5 + 1은 단 하나의 방법으로 Raid 6을 더 나은 옵션으로 선택하기가 쉽습니다. Raid 5의 재 구축이 너무 느리다는 것을 잊지 마십시오. 또한 Raid 6 드라이브가 사용되므로 (올바른 방식으로 테스트 됨) 실패한 드라이브는 매우 빠르게 실패하는 경향이 있음을 알게되었습니다. 어레이가 30 일 이상 가동되면 몇 년 동안 지속되는 경향이 있습니다. 핫 스페어는 테스트를 거치지 않았으므로 필요할 때 즉시 실패 할 수 있습니다.


0

이들은 사건의 사실이며, 논란의 여지가 없습니다 (자신이 말하는 것을 아는 사람이라면 누구나).

  1. RAID5 + 핫 스페어는 말 그대로 가능한 최악의 RAID 선택입니다.
  2. 데이터에 관심이있는 경우 RAID10이 기본 선택이되어야합니다 (예 : 비즈니스를 계속 진행하려면 데이터에 의존 함).

가능한 모든 RAID 옵션을 고려할 경우 RAID5 + 핫 스페어가 최선의 선택이 될 수 없습니다. 주로 RAID5 + 핫 스페어가있는 경우 4 개의 드라이브가 있고 4 개의 드라이브가 있으면 RAID6을 수행하거나 더 나은, 당신은 RAID10을 할 수 있습니다.

4 개의 드라이브를 사용하면 모든 선택 (R5 + HS, R6, R10) 중에서 사용 가능한 스토리지가 동일합니다.

목표가 성능이라면 RAID10은 RAID5 및 RAID6보다 우수합니다.

안전이 목표라면 RAID6 또는 RAID10은 핫 스페어 유무에 관계없이 RAID5보다 우수합니다. 어느 것이 더 안전한지 논쟁의 여지가 있습니다 (6 대 10). RAID6는 2 개의 드라이브 장애를 지속 할 수 있지만 복구 할 수없는 읽기 오류 (URE)로 인해 RAID6의 단일 드라이브 장애로 인해 전체 어레이가 종료 될 수도 있습니다.

RAID10은 패리티 기반이 아니기 때문에 URE와 동일한 문제가 없습니다. 패리티 RAID (R5 등)가 드라이브를 잃은 후 URE가 발생하면 전체 어레이가 손실됩니다. RAID1 또는 RAID10을 사용하면 드라이브가 손실 된 후 미러 디스크에서 URE가 발생하면 읽을 수없는 섹터 만 손실됩니다.

RAID5가 가능한 최악의 이유에 대한 자세한 설명은 여기를 참조 하십시오 . 드라이브 수에 따른 합리적인 RAID 선택 목록여기를 참조 하십시오 . 어떤 경우에도 (핫 스페어에 관계없이) RAID5가 최선의 선택은 아닙니다.


2
동의하지 않습니다. RAID5는 그 용도가 있습니다. (예 : 예산이 부족하고 실제로 디스크 공간이 필요한 경우) 그리고 RAID는 한 번의 디스크 오류로 남아있는 백업을 대체하지 않기 때문에 오후 5 시까 지 사람들이 사무실을 떠나 유지 보수를 수행 할 때까지 많은 시간을 보낼 수 있습니다.
Hennes

"최고의 선택"과 "당신이 감당할 수있는 최고의 선택"사이에는 차이가 있습니다. RAID5는 최고의 선택입니다. 사람들은 최고의 답변을 얻기 위해 이곳에옵니다. 그리고 사람들은 RAID5가 항상 최고보다 낮다는 것을 알고 여기로 떠나야합니다. 어떤 경우에는 RAID0이 RAID5보다 더 안정적 일 수 있습니다. RAID5가 무섭습니다. 많은 경우에 RAID5는 오후 5 시가되지 않을 수 있습니다. RAID5와 관련하여 이론과 실제 세계에는 큰 차이가 있습니다. 여기를
user1594322

RAID10이 URE와 동일한 문제가 없다고 말하는 이유는 전혀 명확하지 않습니다. 4 개의 드라이브 RAID10 설정을 사용하면 하나의 드라이브를 잃어 해당 미러에서 URE가 발생하는 경우 호스가 동일하게 적용됩니다.
ChrisInEdmonton

RAID10에 고장난 드라이브가 있고 남은 드라이브에 URE가 있으면 전체 어레이가 아니라 읽을 수없는 섹터 만 손실됩니다. 답변을 업데이트했습니다.
user1594322 2
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.