Evan은 몇 가지 좋은 점에 부딪 쳤지 만, 여기에는 실패에 대비하여 1 시간 미만의 복구 시간을 얻는 특정한 비용 효율적인 방법이 있습니다.
소규모 비즈니스는 소규모 하드웨어를 의미 할 수 있으므로 문제에 직면 할 때 실제로 상당한 양의 복원력을 추가하는 간단한 작업을 수행하는 데 많은 비용이 들지 않을 수 있습니다. 주요 아이디어는 추가 하드웨어를 준비하는 것입니다.
먼저 가상 IP에 대한 생각에 익숙해 지십시오. 이는 사용자가 대화 할 수있는 IP 주소이지만 사용자가 제공 한 서버에 상주 할 수 있습니다. 이것은 사용자의 IP 주소이며 응용 프로그램은 대화를 원할 것입니다. 그리고 그것은 당신이 원하는 모든 솔루션에 대해 가장 도움이 될 것입니다. VIP가 있으면 장애 조치시 응용 프로그램을 다시 구성 할 필요가 없습니다. 또한 중복 하드웨어가 있으면 1 대신 2 개의 구성 업데이트를 수행하여 관리 오버 헤드가 증가하는 영향을 미칩니다.
라우팅 / 웹 프록시 서버로 시작하면 상자 자체에 저장 해야하는 실제 상태가 아니기 때문에 가장 쉬운 방법 일 것입니다. 따라서 동일한 상자를 복제하여 동일하게 구성하십시오. LAN 세그먼트에 둘 다 연결되어 있고 인터넷이 다른 인터페이스에 있다고 가정하고 케이블이 고장난 경우 케이블을 교체하십시오. 라우팅 관점에서 모든 LAN 클라이언트는 기본 경로에 대해 .1 주소 (VIP)를 대상으로 설정하고 프록시 서버는 서버 A에 .2 주소를, 서버 B에 .3 주소를 제공합니다. 이 방법으로 구성 업데이트를 위해 둘 다 관리 할 수 있습니다 (둘 다 적용). 그리고 장애 조치를 수행하기 위해해야 할 일은 .2에서 .1 IP 할당을 제거하고 .3으로 옮기고 인터넷 연결을 다른 인터페이스로 옮기는 것입니다. 매우 복잡하지 않고, 이해하기 쉽고, 두 번째 상자의 추가 하드웨어 비용이 발생합니다. 인터넷 쪽에서 중복성을 얻을 수 있다면 약간의 복잡성을 추가하고 VRRP와 같은 것을 사용하여 자동 장애 조치를 얻을 수 있습니다.
세부 사항이 없으면 말하기가 어렵지만 웹 서버는 간단 할 수 있습니다. 동일한 구성으로 두 번째 서버를 추가하고 두 서버 사이에 vIP를 생성 한 다음 VIP가 실패한 경우 백업으로 VIP를 이동하십시오. 일반적으로 장애 조치에서 세션 상태가 손실되는지는 신경 쓰지 않습니다 (장애 조치를 일으키는 중요한 문제입니다). 따라서 사용자가 다시 로그인해야한다면 별다른 문제가 없습니다. 다시, vrrp는 자동 장애 조치에 사용될 수 있습니다.
DB로 넘어 가면 훨씬 더 복잡합니다. 대부분의 DB에는 일종의 기본 / 보조 모델이 있는데, 여기서 원본 DB를 보조에 백업 한 다음 모든 트랜잭션 로그 또는 DB 변경 사항을 보조에 복사합니다. 다시, 실제로 DB에 액세스하는 응용 프로그램 / 사용자에 대해 VIP와 이것을 결합 할 수 있습니다. 그러나 장애 조치가 더 복잡합니다. 기본의 장애에 따라 실제로 트랜잭션 로그를 복사하고 남게하려면 드라이브를 실제로 시작해야합니다. 그런 다음 보조를 활성화하십시오. 손실 된 일부 데이터를 허용 할 수 있으면 보조 활성을 즉시 가져올 수 있습니다. 장애 조치 후 서버 B는 이제 기본 서버이며 서버 A를 복원하고 새 백업으로 전환하여 서버 b에 문제가 발생했을 때 실패 할 수 있습니다.
파일 서버는 항상 가장 어려운 부분입니다. DB와 달리 파일 시스템의 내장 기능을 얻는 것이 훨씬 어렵습니다. 그러나 두 번째 서버를 사용하면 파일 시스템에서 변경 사항을 검색하고 새 파일을 보조 파일로 복사하는 스크립트를 간단하게 작성하여 일정 수준의 복원력을 얻을 수 있습니다. 기본적 으로이 작업을 수행하는 cron에서 rsync를 실행할 수 있습니다. 다시 한 번, 사용자에게 제공하는 VIP를 사용하고 장애 조치를 수행 할 때 이전합니다. 스크립트에서는 파일을 전송하기 전에 시스템이 VIP의 소유자인지 확인하는 것이 좋습니다. 실제로 rsync가 잘못된 방향으로 실행되고 사용자가 변경 한 내용을 덮어 쓰지 않으려 고합니다. 파일이 실패하면 일부 파일이 손실 될 수 있습니다.
전화 시스템에 대해 무엇을 할 수 있을지 모르겠습니다. 공급 업체와 설정 방법에 따라 다릅니다. 공급 업체는 탄력성을 위해 기성품 솔루션을 보유하고있을 수 있습니다.
마지막 경고 단어. 사용할 설정을 철저히 테스트하십시오. 중요한 정보를 잃지 않고 장애 조치 방법을 알고 있어야합니다. 필요할 때 작동하는지 테스트 테스트 테스트. 구성 변경, 소프트웨어 업데이트 등이 기본 및 백업 모두에 올바르게 적용되는 프로세스가 있는지 확인하십시오. 좋은 소식은 서버를 업그레이드 할 때 장애 조치를 제어 할 수 있다는 것입니다. 액티브-액티브 설정이 아니기 때문에 보조 서버가 필요할 때 보조 서버가 작동하는지 알 수 없습니다.
저는 텔레콤에서 일하고 있으며 대부분의 경우 지리적 그래픽 리던던시를 포함하여 장비가 매우 중복되어 있습니다. 우리의 첫 번째 실패 지점은 변경 후 중복이 테스트되지 않으며 사용자가 중복 모델의 작동 방식을 모르는 변경을 수행한다는 것입니다. 그러나 모든 장비가 몇 초 안에 자동 장애 조치를 지원해야한다는 추가 문제가 있습니다. 30-60 분 이내에 시작 및 실행해야하는 경우 장애 조치시 수동 개입을 허용 할 수 있습니다. 준비 만하면됩니다. 행운을 빕니다.