리눅스에 적합한 페일 오버 / 고 가용성 솔루션? [닫은]


9

장애 (서버 중단 또는 충돌)가 발생하는 경우 한 서버에서 다른 서버로 응용 프로그램을 마이그레이션해야하는 경우가 몇 가지 있습니다.

solaris에서는 VCS (Veritas Cluster Server)를 사용하여이 작업을 수행합니다. Linux에서 어떤 옵션을 사용할 수 있습니까?

각각의 설치 / 유지 보수 노력 또는 비용 (있는 경우)을 표시하십시오.

-자세한 내용 추가-

복잡성 수준에 대한 아이디어를 제공하려면

  • 실패한 서버가 예고없이 중단되거나 중단 될 수 있으며 여전히 'ping'가능
  • 복구 서버는 장애 조치시 응용 프로그램을 시작해야합니다.
  • 서버 부팅 / 전원주기에 장애가 발생하면 복구 서버를 방해하지 않는 패시브 상태가됩니다.

이것은 데이터베이스가 아닌 데이터 수집 또는 계산 노드이므로 더 간단한 솔루션이 작동 할 수 있습니다.

-더 자세한 내용 (죄송합니다)-

공유 스토리지는 옵션이 아니지만 한 서버에서 다른 서버로 마이그레이션해야 할 상태는 많지 않습니다. rsync를 통해 두 서버를 동기화 상태로 유지합니다.

지금까지 모든 게시물에 대해 대단히 감사합니다.

답변:


10

모든 고 가용성 요구 사항에 대한 http://linux-ha.org/ 노래가 말하는 것처럼 인생에서 가장 좋은 것은 무료입니다.


좋은 책을 추천 해 줄 수 있습니까?
slf

4

Linux에서 다양한 클러스터 솔루션을 사용했습니다. 나는 또한 구성 관리 제안자이므로 설명에 요리사에 대해 조금 추가 할 것입니다.

VCS (Veritas Cluster Server). 오래되었지만 RHEL 3.0에 Linux VCS 클러스터 몇 개를 배포했습니다. RHEL 5.0에서 사용할 수 있기를 바랍니다. 익숙한 영역으로 설정하기가 어렵다는 것을 알고 있어야합니다. 아시다시피 VCS는 비쌉니다. 일화 적으로 VCS는 구성 관리로 설정하기에 적합하지 않습니다.

RHEL과 관련하여 Red Hat Cluster Suite는 RHEL 2.1이 처음 릴리스 된 이후로 크게 발전했습니다. 설정 / 구성 단계는 매우 간단하며 설명서는 매우 완전하고 유용하며 VCS와 마찬가지로 공급 업체로부터 지원을 구입할 수 있습니다. 상용 HA 제품의 경우 RHCS의 가격이 합리적입니다. 구성 관리 만 사용하여 패키지를 설치하고 웹 인터페이스를 통해 "수동으로"유지합니다. 또한 Red Hat 이외의 플랫폼에서 사용하는 사람들도 있지만 직접 경험 한 적이 없습니다.

Linux-HA (drbd / heartbeat)도 훌륭하지만 VCS에서 제공되는 구성은 단순하지만 다루기 어려운 것처럼 보일 수 있습니다. 구성 관리 도구를 사용하면 자동화하기가 매우 쉽습니다.

개념 증명으로 IBM의 HACMP (AIX 클러스터링 소프트웨어)와 함께 Linux 클러스터를 설치했습니다. VCS보다 비싸다는 것을 기억하기 때문에 이것을 권장하지 않습니다. IBM은 HACMP 설치 및 유지 보수에 대한 특정 절차를 가지고 있으며 여기서는 구성 관리를 사용하지 않습니다.


4

Michael은 현재 커뮤니티가 약간 골절되어 있으며 문서는 약간 드문 드문 일입니다.

실제로, 모든 것이 있으며 이해하기가 불가능합니다. 당신이 정말로 원하는 것은 "Pacemaker Configuration Explained"ebook ... ( PDF에 링크 )입니다. 약 12 번 정도 읽은 다음 구현을 시도한 다음 실제로 다시 읽을 수 있도록 12 번 더 읽으려고합니다.

이 시점에서 Linux에 대해 가장 잘 지원되는 클러스터 서비스 구현은 아마도 Novell의 SLES11이 될 것이며 HAE (High Availability Extension) 일 것입니다. 한 달 또는 두 달 전에 나 왔으며, 설정 및 실행 방법을 설명하는 200 페이지의 두꺼운 두꺼운 매뉴얼이 함께 제공됩니다. Novell은 또한 다양한 형태의 Pacemaker 구성을 지원하는 데 뛰어났습니다.

그 외에도 RHEL5의 구현에는 동일한 패키지와 적절한 문서가 있지만 SLES보다 비싸다고 생각합니다. 적어도 그것은 우리를위한 것입니다.

나는 지금 하트 비트를 피하고 Pacekmaker / OpenAIS와 함께 갈 것입니다. 그들은 미래에 훨씬 더 잘 지원 될 것이므로 그러나 현재 커뮤니티의 상태는 전문가가 몇 명이고 프로덕션에서 운영하는 사람이 거의 없으며 완전히 단서가없는 수많은 사람들이 있습니다. Pacemaker 메일 링리스트에 가입하여 Andrew Beekhof라는 사람에게주의를 기울이십시오.

요청 된 세부 사항을 제공하도록 편집하십시오.

Pacemaker / OpenAIS는 '기본 리소스'(예 : nfs-server)에서 '모니터'작업을 사용하여 리소스가 수행중인 작업을 추적합니다. 예제 NFS 서버가 X 초 동안 나머지 클러스터에 응답하지 않으면 클러스터는 STONITH (다른 노드에서 헤드 촬영) 작업을 실행하여 기본 노드를 종료하여 보조 노드를 활성화합니다. 구성에서 수행 할 조치 및 수행 할 조치를 결정합니다. 거기에서 구현 세부 사항은 장애 조치를 시도하는 서비스, 특정 작업 (예 : 기본 노드를 마스터로 승격)과 같은 실행 창 및 가능한 한 거의 구성 가능한 항목에 따라 다릅니다.


1

Linux HA 커뮤니티는 현재 약간 분할되어 있습니다.

이전에 알려진 도구 Linux HA는 현재 PacemakerOpenAIS 이기 때문에 공유없는 아키텍처가 필요할 때 DRBD 와 함께 실행되는 경우가 가장 많습니다 .

이 주제에 관해 좋은 책을 얻는 것이 좋습니다. 왜냐하면이 분야는 매우 포괄적 인 분야이기 때문에 프로젝트의 상태가 일부 벤더 솔루션만큼 사용자에게 친숙하지는 않기 때문입니다.

일부 클러스터 소프트웨어 공급 업체의 Linux 솔루션도 있지만 직접 사용해 본 적이 없기 때문에 이에 대해 많이 말할 수는 없습니다.


1
이 주제에 관한 좋은 책을 제안 해 주시겠습니까?
매트 시몬스

1

Linux에서는 하트 비트 및 drbd로 클러스터링을 구현했습니다. 하트 비트는 서버의 상태를 확인합니다. DRBD는 서버 간의 데이터 동기화에 사용됩니다. 하나의 서버에서 Oracle 서비스를 실행하고 다른 서버에서 Apache를 실행합니다. Oracle을 실행하는 서버가 실패하면 하트 비트는 동일하게 감지하고 Apache를 실행하는 서버에서 Oracle 서비스를 복원합니다. 그 반대도 마찬가지입니다. 다른 많은 목적으로이 설정을 사용해 왔으며 지금까지 신뢰할 수있었습니다.


1

Red Hat Cluster Suite 는 가능한 모든 응용 프로그램에 대해 원하는 작업을 수행합니다. GFS 및 클러스터 LVM과 함께 견고한 공유 스토리지를 가질 수 있습니다.

개별 상자를 계속 유지하는 것보다 유지 관리가 훨씬 어렵지 않습니다. 실제로 응용 프로그램 마이그레이션을 통해 개별 상자를 쉽게 패치 할 수 있습니다.

RHCS는 웹 프론트 엔드 (Luci) 및 GTK 프론트 엔드 (system-config-cluster)와 함께 구성 및 마이그레이션을 클릭 할 수있게합니다. 하나의 중앙 웹 기반 관리 콘솔에서 애플리케이션, 복구 정책, 펜싱 당 페일 오버 도메인을 구성 할 수 있습니다.

RHCS가 실제로 확실한 지원 옵션을 가지고 있다는 사실을 고려할 때 RHCS로 갈 것입니다.

비용이 얼마나 들지 모르지만 수천 달러의 범위에 있다고 생각합니다.


1

UltraMonkey 는 Linux-HA 프레임 워크를 기반으로 구축되었습니다. 필자는 항상이 솔루션을 실제 클러스터보다 더 많은로드 밸런싱 솔루션으로 생각했지만 장애 조치를 잘 처리합니다.


여전히 업데이트 되나요? 웹 사이트는 말합니다 :Copyright © 2000-2005, Horms Last Updated: Sat Mar 4 16:33:57 2006 +0900
NickW

0

Linux Virtual Server를 사용하며 고 가용성을 위해 유지합니다. keepalived는 호스트 자체에서 VRRP를 수행하거나 (다른 서버가 죽어 가고 있다고 생각하는)로드 밸런싱을 수행하기 위해 별도의 호스트에서 설정하여 서비스 가용성을 확인할 수 있습니다. 첫 번째 상황에서 서비스 확인을 구성 할 수 있지만 확인하지 않았습니다. 두 번째 상황은 두 서버를 동시에 실행할 수있는 경우에 특히 좋습니다. 그렇지 않으면 수동 전환을 수행 할 수 있습니다.


0

별도의 컴퓨터가 필요없는 TCP 용 소프트웨어 기반로드 밸런서를 작성했습니다. 멀티 캐스트 링크 레벨 주소에서 IP 주소를 알리고 시스템간에 협상하여 동일한 TCP 연결을 제공하는 두 시스템을 피함으로써 단일 IP 주소를 공유합니다.

단점은 실제로 프로덕션 준비가되어 있지는 않지만 테스트 네트워크에서 테스트하고 싶다면 기뻐할 것입니다.

푹신한 클러스터는 여기

필자는 "alive but sick"상황을 반드시 감지 할 필요는 없지만 구성원 서버간에로드 균형 조정을 수행합니다 (사용자 공간 프로세스가 죽으면 다른 노드가 실패한 노드를 감지하고 제거함)


0

무료는 아니지만 Linux에 자체 HA 솔루션을 설치할 시간이나 전문 지식이없는 사람들은 www.rapidscaleclusters.com에 답하십시오. 몇 분 안에 설치 및 실행이 쉬우 며 지원됩니다.


왜 누군가가 이것을 표시했는지 확실하지 않습니다 ... 이것은 실행 가능한 솔루션처럼 보입니다 (항상 기술적 문제가 있지만 적어도 이것은 첫 번째 인상 인 '서비스'처럼 보이지 않습니다).
ericslaw

0

쉘 스크립트로 작성된 오픈 소스 장애 조치 클러스터 관리자를 만들고 있습니다. 필요한 일부 통합을 놓칠 수 있지만 모양이 좋습니다. https://github.com/nackstein/back-to-work/ 에서보고 싶지 않은 기능이 있는지 확인하십시오.

쉘 프로그래밍 (POSIX 쉘)에 능숙하다면 프로젝트 개발에 참여하실 수 있습니다. : D

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.