서버 재부팅의 원인 식별


8

VMWare ESXi 5.5를 실행 하는 HP ProLiant DL380p Gen8 이 있습니다. 지난 24 시간 동안 임의의 간격으로 재부팅되었습니다. 하나의 VM 만 실행되고 있으며 VM을 종료하더라도 호스트는 여전히 재부팅됩니다. 서버에 메모리 또는 디스크 공간이 부족하지 않으며 과열되지 않습니다. 로그 파일을 살펴 보았지만 볼 것이 너무 많습니다.

이 문제를 진단 할 때 가장 중요한 단계는 무엇입니까 (확인할 설정, 확인할 파일, 문제를 나타내는 특정 메시지, 메모리를 가져 오기 시작해야하는 경우,이 모든 작업을 수행하는 진단 CD가 있는지 여부 등) ?

나는 이것이 매우 광범위한 질문이라는 것을 알고 있습니다. 이 상황을보다 구체적으로 설명하기 위해 필요한 경우 로그 파일을 제공하게되어 기쁩니다.

답변:


9

다음은 몇 가지 제안입니다.

  • ILO가 연결 및 구성되어 있습니까? 시스템에서 무슨 일이 일어나고 있는지 정확하게 알려줍니다. ILO4 로그를 검토하십시오.

  • 시스템의 IML 로그보기 (ILO 또는 vSphere "하드웨어"탭을 통해 사용 가능)

  • 충돌 또는 POST 중에 화면에 표시기 또는 오류 메시지가 있습니까?

  • ESXi의 HP 특정 설치를 사용하고 있습니까 (추가 드라이버 및 도구 포함)

  • 실행중인 ESXi의 버전 및 빌드 번호는 무엇입니까?

  • 실행중인 가상 시스템이 Windows 2012 또는 2008 게스트 인 경우 NIC 드라이버 버그가 발생했을 수 있습니다 .

  • 전원 연결을 확인하십시오. 이중 전원 공급 장치가 있습니까? 전원 케이블을 한 번에 하나씩 다시 장착하십시오.

  • 서버 전면의 System Insight LED 어레이를보고 내부 상태 문제가 있는지 확인하십시오.

여기에 이미지 설명을 입력하십시오


2
그리고 지지자에게도 전화하십시오. 자신을 조사하는 데 약간의 시간을 할애 할 수는 있지만, 이것이 중요한 서버 인 경우 지원 계약에 따라야합니다.
mfinni

ILO를 설정하지 않았습니다. 제안 해 주셔서 감사합니다. 일단 설정되면 로그를 확인하고 이것을 찾았습니다 System Overheating (Temperature Sensor 1, Location Ambient, Temperature 46C). 곧바로 고정하겠습니다.
nachito

이는 서버 룸 또는 환경이 너무 따뜻하다는 것을 의미합니다. 또한 위 이미지의 온도 LED에 빨간색 표시등이 나타납니다. 이 서버를 배포 한시기에 따라 시스템에서 펌웨어 업데이트를 실행할 수도 있습니다.
ewwhite

방 자체가 시원한 72F이기 때문에 다른 랙의 배기 가스 가이 기계의 흡입구에 너무 가깝습니다. 컴퓨터가 재부팅 될 때 시스템을 주시했을 때 OverTemp 플래시가 1 초 동안 보였습니다. 당신이 잘못된 순간에 눈을 깜박이면 완전히 놓친다는 것을 결코 알지 못했습니다.
nachito

3
@nachito ILO와 서버가이 온도 조건과 같은 건강 경고를 이메일로 보낼 수 있다는 것을 알고 싶습니다.
ewwhite
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.