15 개의 동일한 Linux RH 4.7 64 비트 서버가 있습니다. 클러스터 데이터베이스를 실행합니다 (클러스터는 응용 프로그램 수준임). 때때로 (매달 정도) 임의의 상자 (동일하지는 않지만)가 멈 춥니 다.
상자와 핑 작업을 할 수 있습니다. 상자에 ssh하려고하면 다음과 같은 결과가 나타납니다.
ssh_exchange_identification: Connection closed by remote host
SSH가 올바르게 설정되었습니다.
서버 룸에 가서 콘솔에 직접 로그인하려고하면 Alt+ 로 콘솔을 전환 Fn할 수 있으며 사용자 이름을 입력 할 수 있으며 문자가 표시되지만을 누른 후에 Enter는 아무 일도 일어나지 않습니다. 나는 8 시간을 기다렸다가 바뀌지 않았다.
모든 것을 원격 호스트에 기록하도록 syslog를 설정했는데 해당 로그에는 아무것도 없습니다. 컴퓨터를 재부팅하면 문제없이 작동합니다. HW 테스트를 실행했습니다. 모든 것이 정상이며 로그에 아무것도 없습니다. 머신은 NAGIOS로도 모니터링되며 동결 전에 비정상적인로드 나 활동이 없습니다.
나는 아이디어가 부족하다. 다른 무엇을하거나 확인할 수 있습니까?