재현하기 어려운 문제를 나타내는 새로운 HP ProLiant DL360 G7 시스템이 있습니다. POST 프로세스 중에 " 전원 및 열 교정 진행 중 ... " 화면 에서 서버가 임의로 정지 됩니다 . 이것은 일반적으로 설치된 운영 체제에서 웜 부팅 / 재부팅을 따릅니다.
이 시점에서 시스템이 무한정 정지합니다. ILO 3 전원 제어를 통해 재설정 또는 콜드 스타트를 실행하면 시스템이 정상적으로 부팅되지 않습니다.
시스템이이 상태에 있으면 ILO 3 인터페이스에 액세스 할 수 있으며 모든 시스템 상태 표시기가 정상입니다 (모두 녹색). 서버는 PDU에 전원이 연결된 기후 제어 데이터 센터에 있습니다. 주변 온도는 64 ° F / 17 ° C입니다. 시스템은 고장없이 배치하기 전에 24 시간 구성 요소 테스트 루프에 배치되었습니다.
이 서버의 기본 운영 체제는 VMWare ESXi 5입니다. 처음에는 5.0 이상 5.1 빌드를 시도했습니다. 둘 다 PXE 부팅 및 킥 스타트를 통해 배포되었습니다. 또한 베어 메탈 Windows 및 Red Hat Linux 설치로 테스트하고 있습니다.
HP ProLiant 시스템에는 포괄적 인 BIOS 옵션 세트가 있습니다. 정적 고성능 프로필 외에도 기본 설정을 시도했습니다. 부팅 스플래시 화면을 비활성화하고 위의 스크린 샷과 비교하여 그 시점에서 깜박이는 커서가 나타납니다. 또한 BIOS 구성을 위한 몇 가지 VMWare "모범 사례"를 시도했습니다 . 우리는 비슷한 문제를 설명하는 것처럼 보이는 HP 의 권고를 보았지만 특정 문제를 해결하지는 못했습니다.
하드웨어 문제가 의심되면 공급 업체가 당일 배송을 위해 동일한 시스템을 보내도록했습니다. 새로운 서버는 디스크를 제외하고 완전히 동일한 빌드였습니다. 디스크를 이전 서버에서 새 서버로 옮겼습니다. 교체 하드웨어에서 동일한 무작위 부팅 문제가 발생했습니다.
이제 두 서버가 동시에 실행 중입니다. 웜 부팅시이 문제가 임의로 발생합니다. 콜드 부츠에는 문제가없는 것 같습니다. Turbo Boost 비활성화 또는 전원 보정 기능 비활성화와 같은 좀 더 난해한 BIOS 설정을 살펴보고 있습니다. 나는 이것들을 시도 할 수 있지만 필요하지 않아야합니다.
이견있는 사람?
--편집하다--
시스템 정보 :
- DL360 G7-2 x X5670 육각 코어 CPU
- 96GB RAM (12 x 8GB 저전압 DIMM)
- 2 x 146GB 15k SAS 하드 드라이브
- 750W 이중화 전원 공급 장치 2 개
ProLiant DVD 릴리즈 용 최신 HP 서비스 팩을 기준으로 최신의 모든 펌웨어.
HP에 전화를 걸고 interwebz를 트롤링 할 때 ILO 3 상호 작용이 잘못되었다는 언급을 보았지만 실제 콘솔의 서버에서도 마찬가지입니다. HP는 또한 전원을 제안했지만 다른 생산 시스템에 성공적으로 전원을 공급하는 데이터 센터 랙에 있습니다.
저전압 DIMM과 750W 전원 공급 장치 간의 상호 작용이 좋지 않을 수 있습니까? 이 서버 는 지원되는 구성 이어야 합니다.