자체 클러스터를 관리하는 사람들 (즉, Amazon Autoscale, Rightscale, Scalr 등을 사용 / 결제하지 않음) 중에서 EC2에서 인스턴스를 어떻게 관리하고 페일 오버를 처리하고 있습니까? 내가 생각하는 것처럼 대부분의 사람들이 EC2 API에 대해 자체 스크립트로드를 작성하는지 궁금합니다.
이것이 바로 우리의 접근 방식입니다. 오프 사이트에서 실행되고 인스턴스에서 UDP 연결 유지를 수신하는 자체 Python Boto 기반 모니터링 / 재시작 데몬을 채 웁니다. 실패시 볼륨 스냅 샷, 이미지 등록, 새 인스턴스 시작, 이전 볼륨 삭제 등이 수행됩니다.
종종 스크립트를 해킹 할 때 이러한 문제를 해결하고 Scalr의 제약이없는 오픈 소스 도구가 있어야한다고 생각하지만 항상 Google에서 돌아옵니다. 빈손. Scalr과 같은 기능은 지원되는 소프트웨어 세트 / 버전 / 구성에있어 상당히 제한적이며 이러한 설정을 조작하는 특수하고 IMO가 번거로운 방법이 있습니다.
또한 Linux-HA / Pacemaker 에코 시스템 (Heartbeat, ldirectord 등) 은 실제로 EC2에 적합하지 않은 것처럼 들립니다 . (그러나 나는 발견 이 - 아니에요하지만 확인이 정말 높은 품질의 솔루션입니다).