'대형'레이드 5 어레이는 무엇입니까?


11

사무실에있는 Buffalo TeraStation NAS의 최근 문제로 인해 Raid 5를 조사했습니다.

대형 어레이 또는 대형 디스크에서 RAID 5를 사용하는 것이 부적합하다는 것에 대한 몇 가지 다른 기사를 발견했습니다.

다음은 대형 소비자 드라이브가있는 어레이를 재구성 할 때 발생하는 문제에 대해 설명 하는 기사의 예 입니다.

'큰 것'으로 간주되는 것을 해결하려고합니까?

여기에있는 NAS는 4 개의 드라이브 Raid 5 설정이며 각 드라이브는 1TB입니다. 드라이브가 고장 나서 교체되었으며 어레이가 현재 재구성 중입니다.

이 설정은 재 구축 중에 문제가 발생할 가능성이 큰 것으로 구성됩니까?

일상적인 사용을위한이 설정은 얼마나 안정적입니까?


2
일반적인 시스템로드를 감안할 때 컨트롤러가 재구성하는 데 얼마나 걸립니까? HDD의 MTBF는 무엇입니까? 이 두 숫자 중 하나는 RAID를 재 구축하는 동안 두 번째 및 치명적인 오류가 발생할 가능성을 알고 있습니다. HDD는 재 구축 과정에서 가장 많은 스트레스를 받으므로 위의 결과는 이중 실패 가능성을 과소 평가한다는 점을 명심하십시오.
MadHatter

3
옆으로 RAID가 백업이 아님을 알고 있습니까?
cjc

5
@cjc, SF의 모든 RAID 질문에 지혜의 진주를 추가합니까, 아니면 이것에 대해 OP가 RAID가 백업이라고 생각하게합니까?
BlueCompute

예, 알고 있습니다. 레이드 어레이가 제대로 복구되지 않았기 때문에 모든 것을 복원해야하는 번거 로움을 원했습니다.
Rob

답변:


18

디스크 어레이의 안정성 설계 :

  1. 드라이브의 URE 속도를 찾으십시오 (제조업체는 드라이브 고장에 대해 이야기하는 것을 좋아하지 않으므로이를 찾기 위해 발굴해야 할 수도 있습니다. X는 일반적으로 12-18 정도 인 경우 1 / 10 ^ X 여야합니다).
  2. 스토리지 요구에 적합한 수용 가능한 위험률을 결정하십시오 †. 일반적으로 이는 0.5 % 미만의 실패 확률이지만 "스크래치"스토리지에서는 몇 퍼센트가 될 수 있으며 중요한 데이터의 경우 0.1 미만일 수 있습니다.
  3. 1 - ( 1 - [Drive Size] x [URE Rate]) ^ [Data Drives‡] = [Risk]
    두 개 이상의 패리티 디스크가있는 어레이 또는 미러에 디스크 쌍이 두 개 이상있는 미러의 경우 1어레이 의 이후 드라이브를 패리티 / 미러가있는 디스크 수로 변경하십시오 .

따라서 어레이에 4 개의 1TB WD Green 드라이브 세트가 있습니다. URE Rate는 1 / 10 ^ 14입니다. 그리고 나는 그것들을 스크래치 저장 장치로 사용합니다. 1 - (1 - 1TB x 1/10^14byte) ^ 3=> 3.3%하나의 드라이브가 죽은 후 어레이를 재 구축하는 데 실패 할 위험이 있습니다. 이것들은 내 쓰레기를 저장하는 데는 좋지만 중요한 데이터는 저장하지 않습니다.

† 허용 가능한 실패를 결정하는 것은 길고 복잡한 과정입니다. 로 요약 할 수 있습니다 Budget = Risk * Cost. 따라서 실패 비용이 $ 100이고 10 %의 확률로 발생 하는 경우이를 방지하기 위해 $ 10의 예산 이 있어야 합니다. 이는 위험, 다양한 장애 비용 및 잠재적 예방 기술의 특성을 결정하는 작업을 크게 단순화하지만 아이디어를 얻습니다. [Data Drives] = [Total Drives] - [Parity Drives]. 2 개의 디스크 미러 (RAID1) 및 RAID5에는 1 개의 패리티 드라이브가 있습니다. 3 개의 디스크 미러 (RAID1) 및 RAID6에는 2 개의 패리티 드라이브가 있습니다. RAID1 및 / 또는 사용자 지정 구성표로 더 많은 패리티 드라이브를 가질 수 있지만 일반적이지 않습니다.


그러나이 통계 방정식에는 다음과 같은 경고가 있습니다.

  • URE Rate는 알려진 속도이며 일반적으로 조립 라인을 롤오프하는 대부분의 드라이브에서 더 좋습니다. 운이 좋으면 광고 한 것보다 훨씬 큰 드라이브를 구입할 수 있습니다 . 마찬가지로 영아 사망으로 사망하는 운전을 할 수 있습니다.
  • 일부 제조 라인에는 불량 실행 (실행중인 많은 디스크가 동시에 실패 함)이 있으므로 다른 제조 배치에서 디스크를 가져 오면 동시 실패 가능성을 분산시키는 데 도움이됩니다.
  • 오래된 디스크는 재 구축으로 인해 죽을 가능성이 높습니다.
  • 환경 적 요인으로 인해 많은 비용이 소요됩니다.
    • 일반적으로 열을 순환하는 디스크는 죽을 가능성이 높습니다 (예 : 정기적으로 전원 켜기 / 끄기).
    • 진동은 모든 종류의 문제를 야기 할 수 있습니다 . 디스크 배열에서 소리를 지르는 YouTube IT 비디오를보십시오 .
  • "거짓말, 저주받은 거짓말, 통계"의 세 가지 종류가 있습니다-Benjamin Disraeli

장치의 / out /을 가져간 드라이브는 Samsung HD103SI 1TB 드라이브입니다. 나머지 세 개의 드라이브는 동일하다고 생각합니다. 교체 용 드라이브는 다른 제조업체에서 구입 한 것이므로 세부 정보를 알 수 없습니다.
Rob

이 드라이브의 속도는 다음과 같이 1 / 10 ^ 15입니다 .- comx-computers.co.za/HD103SI-specifications-28474.htm
Rob

1
방금 방정식을 수정했지만 예제가 정확했습니다. 이제 둘 다 맞습니다. 배열은 1-(1-1099511627776*0.000000000000001)^3=> 0.00329입니다. ^3안쪽에 있어야 하는 바깥쪽에 브래킷 이 있습니다. 1 / 10 ^ 15에 0이 더 있어야합니다.
Chris S

2
1TB 드라이브는 1000000000000 바이트이므로 URE Rate에 따라 3 % | 0.3 %보다 약간 작습니다.
user9517

1
@IanRingrose 통계적으로 유효합니다. 이미 귀하의 특정 문제를 해결했습니다. 이미 언급 된 것 외에 추가 할 내용이 있습니까?
Chris S

9

이 기사가 존재하는 이유는 HDD에서 복구 할 수없는 비트 오류율에주의를 집중시키기 위함입니다. 특히 저렴한 '홈 PC'디스크입니다. 일반적으로 공장 사양은 1 / 10 ^ 14입니다. 이것은 약 12.5TB의 데이터이며, 2TB 디스크로 RAID-5를 수행하는 경우 매우 빠르게 타격을받습니다.

즉, 다음 중 하나를 수행해야합니다.

  • 더 작은 RAID 그룹을 사용하고 더 많은 낭비 공간을 수용하십시오.
  • RAID-6을 사용하고 추가 쓰기 패널티를 수락하십시오. (RAID5보다 50 % 높음)
  • 더 비싼 디스크를 구입하십시오- '서버 등급'의 UBER 사양은 1 / 10 ^ 16입니다. 이것은 요점입니다. (1.2PB가 12.5TB보다 낫습니다)

일반적으로 RAID-6이 일반적으로 발전하는 방법이라고 제안하지만 성능이 저하됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.