답변:
우선:
MTTF = 평균 고장 시간
MTTR = 평균
고장 시간 MTBF = 평균 고장 간격 = MTTF + MTTR
MTBF는 수리에 1 시간이 걸리고 MTTF는 수만 시간 일 수 있기 때문에 MTTF와 다소 비슷합니다. 그러나 결함이있는 제품은 수리되지 않고 단순히 교체하기 때문에 MTBF는 종종 적용되지 않습니다.
MTTF 계산은 각각의 모든 개별 부품의 고장 확률을 계산하는 복잡한 통계 방법입니다. 사람들이 때때로 추정하는 것처럼 그것은 선형적인 것이 아닙니다. MTTF가 1000 000 시간 인 경우 1000 개의 장치에서 1000 시간 후에 고장이 발생하거나 1 시간 후에 1000 000 개의 장치에서 고장이 발생한다는 의미는 아닙니다.
많은 전자 장치는 따라 "욕조 곡선" ,
초기에 많은 장애가 발생한 경우 거의 실패하지 않은 채 오랜 시간이 걸리고 수명이 다가 오면 실패 횟수가 다시 증가합니다. 하드 디스크에는 더 선형적인 고장 곡선을 갖는 일부 기계 부품이 있습니다. 1 일부터 천천히 증가합니다.
제조업체에서 예를 들어 MTTF (가장 자주 POH 또는 Power-On Hours)가 1000 000 시간이라고 말하면 평균적 으로 드라이브가 100 년 이상 지속되어야 한다는 의미입니다 . 일부 드라이브는 더 오래 지속되고 일부 드라이브는 더 일찍 고장납니다. 따라서 1000 000 시간에도 불구하고 1000 시간 후에도 실패 할 수 있습니다. 나는 일주일 이내에 운전이 실패한 후 욕조 곡선을 다시 생각해야합니다. 교체 드라이브가 5 만 시간을 초과하여 행복하게 회전했습니다.
장비의 MTBF 사용량이 1,000,000 시간 인 경우, 장비가 1,000,000 시간 동안 지속될 수 있음을 의미하지는 않습니다. 이는 대략 정격 수명 기간 내에있는 1,000,000 개의 장비가 각각 1 시간 동안 작동되거나 10 시간 동안 (그러나 여전히 정격 수명 내에있는) 100,000 개 또는 1 분 동안 60,000,000 개의 장비가 작동하는 경우를 의미합니다. 로트에는 대략 하나의 실패가있을 것입니다. 정격 수명은 MTBF와 완전히 직교한다는 점에 유의하십시오. 다음 두 가지 유형의 위젯을 고려하십시오.
첫 번째 유형의 위젯은 평균 수명이 약 1,000 시간이고 MTBF가 약 1,000 시간입니다. 두 번째는 평균 수명은 61 분이지만 MTBF는 서비스 수명 내에서 1,000,000,000 시간입니다. 두 번째 장치에 예상 수명보다 거의 10 억 배나 긴 MTBF가 있다고해도 이상하게 보일 수 있지만 MTBF는 의미가 없습니다.
1,000,000 개의 장치가 모두 한 시간 동안 완벽하게 작동하고 그 후에 모두 폐기 될 실험을 수행한다고 가정 해 봅시다. 기기가 고장 나면 전체 실험이 중단됩니다. 평균 1,000 시간 지속되지만 MTBF는 1,000 시간에 불과한 장치 또는 최대 61 분 동안 지속되지만 10 억 번의 실패 확률을 가진 장치는 더 유용합니다. 그 마크를 만나?
stevenvh의 답변에 추가 : 잘 알려진 디스크 제조업체는 모두 전자 부품 제조업체와 마찬가지로 새로운 장치를 번인 (burn-in) 방식으로 운영합니다. 하드 디스크에는 전체 MTBF 및 MTTF 뿐만 아니라 디스크 블록에 대한 개별 장애 통계도 있습니다. 다시 말해, 회전의 일부 부분 인 디스크의 "플래터"는 실패 할 수 있지만 대부분은 여전히 읽기 / 쓰기가 가능합니다. 소위 "불량 섹터"를 감지 한 다음 드라이브 내부의 펌웨어로 매핑 할 수 있습니다.
오늘날 모든 드라이브에는 예비 섹터에 추가 섹터가 포함되어 있으며 결함 섹터 대신 사용할 수 있습니다. 이것은 제조업체의 예방책 일뿐입니다. 이렇게하지 않으면 디스크를 판매 용량으로 팔 수 없었습니다. 이들이 예비 섹터로 숨겨진 x %의 추가 x %를 구축하면 비용을 <x % 정도 증가 시키지만 전체 생산량은 훨씬 더 높아집니다.
오늘날 디스크는 적절한 소프트웨어로 읽을 수있는 불량 섹터 수를 유지합니다. 이 및 기타 디스크 상태 매개 변수 (예 : 온도)를 SMART 값 이라고 합니다.
이제 제조업체가 드라이브 번인 테스트를 수행하고 일부 섹터가 거의 고장을 일으켜 드라이브의 내부 펌웨어에 의해 다시 매핑되면 "Bad Sector Count"SMART 매개 변수가 0으로 설정됩니다. 드라이브는 고객에게 제공됩니다.
일반적으로 번인 (burn-in) 공정 후 이미 언급 한 욕조 곡선의 시작은 더 이상 고객에게 보이지 않습니다. 우리는 운이 좋으며 시간이 지남에 따라 실패 가능성이 증가합니다.
따라서 제조업체가 인용 한 MTTF를 보면 실패 모델링을 수행하려는 경우 욕조 곡선의 시작을 무시할 수 있습니다.
이를 마케팅으로 해석해야합니다. 그들은 실제로 정확한 MTBF (평균 고장 간격)를 알지 못하므로 다양한 트릭을 사용하여 추정하고 비용을 정당화하기 위해 '엔터프라이즈'드라이브에 더 많은 숫자를 표시합니다.
실제로, 보증 기간이 만료 된 직후 HDD 제조업체가 HDD 고장을 일으키는 것이 유리합니다.
음모론으로서 Seagate 7200.11의 대량 실패는 보증이 끝나기 전에 디스크가 고장 나는 '프로그램 된 죽음'을 구현하는 실수 였으므로 펌웨어 업데이트로이를 수정해야했습니다.