올바른 순서로 서버를 다시 시작하도록 UPS를 구성하는 방법은 무엇입니까?


12

여기에는 일부 서버가 있으며 거의 ​​각 서버에는 전용 UPS가 있습니다. 그들 사이에 종속성이 있으므로 올바른 순서로 켜야합니다. 궁극적으로 전원 공급 장치에 심각한 문제가 발생하므로 전원이 복구되면 서버가 임의의 순서로 종료되었다가 다시 시작됩니다. 정전 중에 서버가 꺼진 경우에는 문제가되지 않습니다. 일단 전원이 복구되면 사람의 개입없이 올바르게 작동하는 것이 중요합니다.

우리의 UPS는 매우 싸고 나의 목표에 유용한 유일한 구성 매개 변수는 power the load xx seconds after power is restored입니다. 이론적으로 각 UPS에 올바른 지연을 두는 것은 서버 재시작 순서를 수정할 수는 있지만 UPS가 예상대로 작동한다는 것을 확신하지는 않습니다.

올바른 방법입니까?
상위 레벨 UPS는 재시작 순서를 수정하기위한 다른 옵션을 제공합니까?
마지막 참고 사항 : 내 Ups의 범위는 1000-2200 VA입니다.


1
이것은 systemd시작 프로세스에서 적절한 종속성을 정의 할 수있는 기능 중 하나입니다 . 서비스 Y를 시작하기 전에 서비스 X가 사용 가능할 때까지 기다리십시오.
MSalters

1
@MSalters AFAIK 시스템 의존성 관리는 장치가 동일한 systemd인스턴스에 의해 처리되고 완전히 다른 서버에서 실행되는 서비스가 아닌 경우에만 작동 합니다.
HBruijn

1
@HBruijn : 예를 들어 서버에서 작동하는 일종의 네트워크 마운트. 즉, server1이 server2에서 호스팅하는 파일 시스템을 마운트하면 마운트에 의존하는 serve1의 서비스는 server2가 해당 서비스를 시작할 때까지 일시 중지됩니다. 그리고 IIRC는 또한 서버가 DHCP를 기다리도록 할 수 있습니다 (서버가 DHCP를 사용하는 이유를 묻지 말고 답에 언급했습니다)
MSalters

답변:


25

이에 대한 표준 답변은 "아직 아님"입니다. 재시작을 무작위 순서로 처리하도록 소프트웨어를 수정하십시오. 실제로 일부 서버를 시작해야하는 경우 (예 : Active Directory) LOT 수명이 긴 USV에 배치하십시오. 저전력 원자 기반 서버는 Active Directory 컨트롤러만큼 충분하며 소규모 USV에서도 하루 동안 지속됩니다.

상위 레벨 UPS는 재시작 순서를 수정하기위한 다른 옵션을 제공합니까?

아니요. 일반적으로 프로그래머가 문제를 올바르게 해결할 수있는 능력이 있다고 가정합니다.

당신이 할 수있는 일은 :

  • 서버가 "무작위로"시작되도록하십시오. DHCP / Active Directory를 제외하고는 고칠 수없는 주문을 실제로 요구하는 것은 없습니다.
  • 일정 시간 (5 분) 후에 여러 서버에서 올바른 순서로 서비스를 시작한 후 제어 서버를 사용하십시오.

이 유형의 설정이 훨씬 일반적이라고 말할 수 있습니다. REQUIRES 서버가 특정 순서로 (순수 인프라 이외의) 시작하여 비즈니스에 적합하지 않은 소프트웨어를 호출합니다.

참고로, 자체 설정은 서버의 저비용 20kva USV (하나는 사용했기 때문에 저비용)이며 네트워크 (및 백업 시스템)의 "루트"역할을하는 컴퓨터의 슬레이브 2000VA USV입니다. Slaved는 USV가 큰 것 뒤에 있다는 것을 의미합니다. 따라서 큰 것 (컴퓨터 그리드의 온라인 상태에 따라 30 분에서 8 시간 동안 지속됨)이 터미널 종료에 들어갈 때만 배터리로 전환됩니다.


2
나는 이것이 때때로 말한 것보다 쉽지 않다고 생각하지만 (AD는 명백한 예입니다) 동의합니다. 올바른 솔루션은 서버 또는 서비스의 시작 순서와 같은 항목에 대한 종속성을 제거하는 것입니다. 다른 어떤 것도 없다면, 예를 들어 "백엔드에 연결할 수 없으면 '잠자기'하고 나중에 충돌하지 않고 나중에 다시 시도하십시오"라는 코드를 작성하는 것이 웹 앱에서 가능해야합니다.
Rob Moir

AD의 문제는 AD조차도 아닙니다. 대부분의 IPv4 DHCP는 DHCP 서버 이전에 컴퓨터가 온라인 상태가 될 준비가되어 있지 않습니다. Ipv6는 이것을 처리합니다;)
TomTom

사실입니다. IPv4는 고통입니다 ... 그리고 저는 여전히 사람들에게 왜 "이 새로운 IPv6 쓰레기"를 귀찮게해야하는지 묻습니다.
Rob Moir 2016 년

1
"일반적으로 프로그래머는이 문제를 해결할 수있는 능력이 있다고 가정합니다"-많은 프로그래밍을 수행해서는 안됩니다! 아니요, 모든 진지한 상황에서 시스템을 특정 순서로 불러야하는 이유는 매우 많습니다. 예, 소프트웨어가 "정상적으로 실패"한 후 끊어진 연결을 다시 시도해야하지만 항상 가능한 것은 아닙니다. 내가 기억하는 것에서, 멋진 PDU 중 일부는 개별 포트를 시작 / 중지하는 기능을 가지고 있으므로 아마도 거기에서 무언가를 할 수있을 것입니다.
SnakeDoc 2016 년

1
"USV"를 검색하고 "Unmanned surface vehicle"을 찾았습니다. 나는 이것이 잘못되었음을 알고 있지만 그것이 옳기를 원합니다.
Braiam

14

관리 형 배전 장치 (UPS 대신)는 종종 전원이 재개 된 후 개별 콘센트를 활성화 할 때 맞춤형 지연을 지원합니다.

일반적으로 이는 전원이 복원 된 직후에 시스템으로 가득 찬 캐비닛의 전원이 동시에 켜질 때 회로 차단기가 트립되는 것을 방지하기위한 것이지만 시스템 종속성의 부팅 순서를 유지하는 데 사용될 수도 있습니다.


네 맞아요 이것은 고급 기능이며 USV가 실제로 서버에 연결되어 있다고 가정하지는 않지만 PDU를 사용하여 세부 정보를 처리하는 랙에 전원을 공급합니다.
TomTom

6

나는이 정확한 문제가 있었다. 견고한 랙 장착형 APC 전원 장치 (예 : APC SmartUPS 3000 )에 투자 한 유일한 차이점 입니다. APC PowerChute 네트워크 셧다운 소프트웨어 ( PowerChute Network Shutdown 소프트웨어) 를 사용하면 특정 순서로 서버를 셧다운하고 불러올 수 있습니다. 소프트웨어의 또 다른 편리한 기능은 마지막 순간에 서버가 종료되도록 설정하는 것입니다. 즉, APC 장치가 남은 배터리 전력량을 계산하고 전원을 끄는 대신 제대로 종료하기에 충분한 시간으로 서버를 종료합니다.

이 소프트웨어는 사용자에게 친숙하지 않지만 시간을내어 이해하는 데 어려움이 없습니다. 인프라 스트럭처에 더 많은 투자를하고자한다면, 이것이 바로 갈 길입니다.


1
우리는 Apc Smart Ups도 가지고 있으며, 그중 일부는 상대적으로 오래되어 배터리가 약합니다. 테스트가 진행 중이므로 테스트를하기가 어렵습니다. 우리에게는 괴물 부하가 없기 때문에 문제없이 갑자기 전원을 끌 수있는 부하를 의미합니다. 즉, UPS가 예상과 다르게 작동하는 정전을 시뮬레이트 할 때마다 구성이 잘못되었을 수 있지만 UPS의 신뢰성이 떨어 졌다는 느낌이 들었습니다.
Filippo

@Filippo는 확실히 YMMV이지만 3 년 동안 PowerChute 소프트웨어를 사용하여 여러 사이트에 SmartUPS 3000과 3000XLM을 혼합하여 사용했으며 소프트웨어를 알아 낸 후에는 학습 곡선이 있으며 일부 테스트가 필요하며 꽤 견고했습니다.
Winski Tech 2016 년

2

UPS 장치가 저렴하고 전원이 복구 된 후 특정 출력 대기 시간에 대해 구성 할 수없는 것처럼 들립니다 (일부 고급 장치가 있음). 동일한 기능을 사용하려면 특정 호스트를 선택하여 항상 즉시 전원을 켜고 (어느 때나 부팅 할 수있는 시스템이있을 수 있음) 다른 모든 서버는 전원이 꺼진 상태 (BIOS에서 전원으로 돌아가도록 구성)로 두어야합니다. AC가 적용되면 꺼지고 Wake On Lan 마법 패킷이 적용되도록 전원이 켜집니다. 그런 다음 부팅하는 기본 호스트에서 스크립트 / 유틸리티를 실행하여 WOL 매직 패킷이 각 호스트로 전송되는 시간을 정하십시오.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.