스토리지 서버를 구축하고 싶었습니다 10 x 2TB WD RED's
. HDD's
단지 도착했다.
실제 데이터를 디스크에 복사하기 전에 불량 드라이브를 확인하거나 유아 사망률을 가장 잘 방지하기 위해 사용하는 도구가 있습니까?
많은 데이터를 복사하여 각 단일 항목을 확인 HDD
하거나 배열 ( ZFS raid-z2
) 을 테스트하는 것이 더 낫 습니까?
스토리지 서버를 구축하고 싶었습니다 10 x 2TB WD RED's
. HDD's
단지 도착했다.
실제 데이터를 디스크에 복사하기 전에 불량 드라이브를 확인하거나 유아 사망률을 가장 잘 방지하기 위해 사용하는 도구가 있습니까?
많은 데이터를 복사하여 각 단일 항목을 확인 HDD
하거나 배열 ( ZFS raid-z2
) 을 테스트하는 것이 더 낫 습니까?
답변:
나는 2 개월 전에 같은 질문을했다. 고장난 디스크를 보낸 후 3 일 후에 교체 디스크가 NAS에서 고장났습니다. 그래서 새로운 교체품을 생산하기 전에 시험해보기로 결정했습니다. 구매 한 모든 새 디스크를 테스트하지는 않으며 완전히 새로이 신뢰되지 않는 '리퍼브 된'디스크에서만 테스트합니다.
이러한 디스크를 테스트 하려면 새 하드 디스크 에서 불량 블록 검사 및 확장 된 SMART 테스트를 실행하는 것이 좋습니다 .
2TB 디스크에서 최대 48 시간이 소요되며 badblock 명령은 디스크를 패턴으로 가득 찬 다음 블록을 다시 읽고 패턴이 실제로 있는지 확인한 후 4 가지 패턴으로 반복합니다.
요즘 디스크는 불량 블록을 재 할당하므로이 명령은 실제로 새 디스크에 불량 블록을 표시하지 않을 것입니다.
그래서이 전후에 나는 스마트 테스트를 실행하고 재 할당되고 현재 보류중인 섹터 수를 확인합니다. 이 중 하나라도 문제가 발생하면 디스크에 이미 불량 블록이 있으므로 신뢰할 수없는 것으로 판명 될 수 있습니다.
이 후 확장 SMART 테스트를 다시 실행합니다.
smartctl 또는 smartmontools를 먼저 설치할 수 있습니다.
경고 , badblocks -w 플래그는 디스크를 덮어 쓰지 않고 읽기 확인을 원할 경우 디스크의 모든 데이터를 덮어 씁니다.badblocks -vs /dev/sdX
sudo smartctl -a /dev/sdX
# record these numbers
sudo badblocks -wvs /dev/sdX
# let it run for 48 hours
sudo smartctl -a /dev/sdX
# compare numbers
sudo smartctl -t long /dev/sdX
# this might take another hour or 2, check results periodically with
sudo smartctl -a /dev/sdX
이 후에 스마트 값이 정상으로 보이면 디스크를 신뢰할 것입니다.
각 스마트 가치가 무엇을 의미하는지 알기 위해 여기를 살펴볼 수 있습니다.
http://en.wikipedia.org/wiki/Self-Monitoring,_Analysis,_and_Reporting_Technology
이들은 새로운 디스크입니다. 그들은 실패하거나 실패하지 않을 것입니다. ZFS 파일 시스템을 사용하면 이미 큰 발전 을 이룰 수 있습니다. 이는 습격 및 파일 시스템 상태에 대한 훌륭한 통찰력을 제공합니다 ...
나는 단지 배열을 구축하는 것 외에는 아무것도하지 않을 것입니다. 이것이 중복의 요점입니다. 나열된 다른 방법으로는 드라이브 고장을 유발할 수 없습니다.
테스트를 위해 Bonnie ++를 사용할 수 있습니다. 파일 서버 동작 패턴을 완벽하게 에뮬레이트 할 수 있습니다.
예를 들면 다음과 같습니다.
# bonnie++ -u nobody -d /home/tmp -n 100:150000:200:100 -x 300
테스트는 사용자 'nobody'로 실행되며 / home / tmp 아래 100 개의 자동 생성 된 디렉토리 내에서 파일 당 200에서 150000 바이트까지 100 * 1024 파일을 생성 / 재 작성 / 삭제합니다. 그리고 테스트 수 = 300입니다. 파일 수 / 크기 및 테스트 반복 횟수를 중심으로 재생할 수 있습니다.
나는 이런 종류의 테스트를 매일 매일 수행하는 회사에서 일합니다. 그리고 그렇습니다. 우리는 구매하는 모든 하드 드라이브를 테스트합니다. 우리의 프로세스는 HDAT2라는 무료 DOS 기반 프로그램을 통해 드라이브를 실행하는 것으로 시작합니다. 무료로 다운로드 할 수 있습니다. SMART 및 Windows 환경에서 액세스 할 수없는 드라이브의 다른 기능에 액세스 할 수 있습니다. 결과에 따라 여러 가지 특수 하드웨어 라인 중 하나를 통해 결과를 실행하지만 핵심적으로는 SMART 짧은 자체 테스트, Long Test, 보안 지우기 및 전체 읽기를 실행하여 섹터를 확인합니다. 내 제안은 전체 디스크를 안전하게 지우고 모든 읽기를 실행 한 다음 SMART 짧은 자체 테스트를 수행하는 것입니다. 테스트가 시작될 때 짧은 자체 테스트를 실행해도 아무것도 발견되지 않지만 디스크를 완전히 읽고 읽은 후에는 무언가를 선택할 수 있으므로이 순서는 중요합니다. 이것이 도움이되기를 바랍니다.