중요하지 않은 서버 란 무엇입니까? 실패 할 수있는 것?
ECC RAM은 기본 메모리의 신뢰성이 근본적인 때.
메모리 크기가 증가함에 따라 두 가지가 커집니다.
- 메모리에 대한 소프트웨어의 의존성 esp. 서버 소프트웨어 (예 : 캐싱)
- 메모리 오류 확률 (p = num_bits * p_bit_failure)
ECC에 대한 이 인텔 프레젠테이션은 다음 사실을보고합니다.
- 24 시간 연중 무휴로 실행되는 4GB 메모리가있는 서버의 평균 메모리 오류율은 연 150 회입니다.
- 매년 메모리 모듈 당 ~ 4000 개의 수정 가능한 오류
- 오버 클로킹 및 시스템 수명은 실패율을 크게 증가시킵니다.
- 재발 실패는 흔하며 빠르게 발생합니다 (97 %는 첫 번째 실패 후 10 일 이내에 발생) => 눈사태 효과
- 수명이 3-5 년인 ECC 서버의 경우 시스템 오류 수정 불가능 메모리 오류가 0.001 % 미만입니다.
WISC의 또 다른 최근 연구에 따르면 ECC는 이러한 ZFS 시스템에 필수적입니다.
ZFS에는 메모리 손상에 대한주의 사항이 없습니다. 잘못된 데이터 블록이 사용자에게 반환되거나 디스크에 기록되고 파일 시스템 작업이 실패하며 전체 시스템이 여러 번 충돌합니다.
다른 파일 시스템은 ZFS만큼이나 이러한 형태의 데이터 손상에 민감합니다.
ECC는 가능할 때 이러한 문제가 발생하는 것을 막아 주며, 재난이 발생할 경우 너무 늦기 전에 이러한 상황에 대해 경고합니다.