Sobrique는 수동 개입을 통해 제안 된 솔루션이 어떻게 최적의 상태를 유지하는지 설명 하고 ewwhite는 다양한 구성 요소의 고장 가능성에 대해 설명합니다 . 이 두 가지 IMO는 매우 좋은 지적을하므로 강력히 고려해야합니다.
그러나 아무도 지금까지 전혀 언급하지 않은 것처럼 보이는 한 가지 문제가 있습니다. 당신은 제안합니다 :
[현재 핫 스페어 호스트]를 콜드 스페어로 만들고 하드 드라이브를 가져 와서 기본 호스트에 넣고 RAID를 1에서 1 + 1로 변경합니다.
이렇게하면 OS가 디스크에서 수행하는 작업으로부터 보호 할 수 없습니다.
미러 (RAID 1)에서 미러 미러 (RAID 1 + 1)로 이동하면 디스크 장애로부터 사용자를 보호 할 수 있습니다. 각 미러 세트의 디스크 수를 늘리면 (예 : 2 디스크 RAID 1에서 4 디스크 RAID 1로 이동) 일반적인 작업 중에 읽기 성능이 크게 향상 될 수 있습니다.
그렇다면 이것이 실패 할 수있는 몇 가지 방법을 살펴 보자 .
- 시스템 업데이트를 설치하는 중이고 프로세스가 도중에 실패한다고 가정 해 봅시다. 어쩌면 거기의 전원 및 UPS 장애 (리눅스는 요즘 꽤 안정적이지만, 아직 거기 위험), 또는 어쩌면 당신은 괴물 사고를하고 타격 커널의 버그를했다.
- 업데이트로 인해 기본 시스템을 수정하는 동안 보조 시스템으로 장애 조치를 수행해야하는 테스트 중 테스트하지 않은 문제 (시스템 업데이트 테스트를 수행 할 수 있습니까?)가 발생할 수 있습니다.
- 파일 시스템 코드의 버그로 인해 디스크에 잘못된 쓰기가 발생할 수 있습니다.
- 어쩌면 뚱뚱한 (또는 악의적 인) 관리자가
rm -rf ../*
또는 rm -rf /*
대신 했을 수도 rm -rf ./*
있습니다.
- 자체 소프트웨어의 버그로 인해 데이터베이스 내용이 크게 손상 될 수 있습니다.
- 바이러스가 몰래 침입했을 수도 있습니다.
어쩌면 어쩌면 어쩌면 ... (그리고 당신의 제안 된 접근법이 실패 할 수있는 더 많은 방법이 있다고 확신합니다.) 그러나 결국 이것은 "두 세트는 항상 동기화되어 있습니다" "이점"으로 귀결됩니다. 때로는 완벽하게 동기화 되기를 원하지 않습니다.
정확히 무슨 일이 있었는지에 따라 핫 또는 콜드 스탠바이를 켜고 다시 켜거나 적절한 백업을 원할 때입니다. 어느 쪽이든 장애 미러 모드 (또는 RAID 미러)는 장애 모드에 하드웨어 스토리지 장치 장애 (디스크 충돌) 외에 많은 것이 포함되어 있으면 도움이되지 않습니다. ZFS의 raidzN과 같은 것은 일부 측면에서 조금 더 나을 수 있지만 다른 측면에서는 전혀 나을 수는 없습니다.
나에게 이것은 의도가 어떤 종류의 재난 장애 조치 인 경우 제안 된 접근 방식을 처음부터 무용지물로 만들 것입니다.