총 정지 원인을 조사하는 방법은 무엇입니까?


19

아치 시스템이 때때로 정지하여 마우스 나 키보드에 갑자기 응답하지 않습니다. 커서가 정지되었습니다. Ctrl-Alt-Backsp는 X11을 멈추지 않으며 ctrl-alt-del은 정확히 아무것도하지 않습니다. conky 및 icewm의 CPU, 네트워크 및 디스크 활동 플롯은 업데이트를 중지합니다. 몇 분 안에 팬이 켜집니다. 컴퓨터가 무엇이든 할 수있는 유일한 방법은 전원을 끄는 것입니다.

부팅시 CPU 온도 모니터에 70 ~ 80C가 표시됩니다. 교수형이 있기 전에는 보통 50C 정도의 웹 서핑과 같은 저 강도 활동을하고있었습니다.

로그는 정상적인 종료와 비교하여 특별한 것을 보여주지 않습니다. 결함이없는 상태에서 메모리 검사기가 정상적으로 작동합니다.

끊어진 이유를 어떻게 조사 할 수 있습니까? 힌트를 얻을 수있는 추가 정보가 있습니까? 제한된 껍질 만 있거나 신호음이 울리더라도 전원을 끄는 것보다 과감한 것이 있습니까? 단서가있을 수 있습니까?

이 기계는 Gateway P6860 17 "랩탑 (대단하지만 강력한)이며 최신 버전 (2011 년 3 월 기준)으로 아치 64 비트를 실행하고 있습니다.이 문제없이 오랫동안 아치가 있었으며 약 1 주일 동안 우분투로 전환했습니다. 그런 다음 아치를 새로 설치하여 철수했습니다.

업데이트 : 예, 확실히 과열됩니다. 한 온도에서 마우스와 키보드가 작동을 멈추고 때로는 몇 분 동안 냉각 된 후에 작동합니다. 더 높은 온도에서는 SysRq 무시를 포함한 전체 비 응답 성과 같은 더 나쁜 상황이 발생합니다. 이 상태는 잠시 후 갑자기 전원이 꺼집니다. 새 컴퓨터 8D를 구입하여 문제를 해결했습니다

답변:


7

커널이 여전히 실행 중이고 실제로 중단되지 않은 경우 Magic SysRq 및 커널 덤프와 관련된 Frederik의 답변이 작동합니다. 커널은 어떤 이유로 바쁘게 돌아가고있을 수 있습니다.

Ctrl-Alt-Del에 응답하지 않는다는 사실은 아마도 그렇지 않으며 기계가 열심히 잠겼다는 것을 알려줍니다. 즉, 하드웨어 오류 또는 불량 드라이버와 밀접한 관련이 있습니다.

메모리 검사 테스트는 충분히 오래 실행하면 좋습니다. 또한 StressLinux 와 같이 시스템을 시도하고 스트레스를주기 위해 다른 것들을 시도해야합니다 . 장기 실행 벤치 마크도 좋습니다.

또 다른 시도는 Ubuntu 라이브 CD로 시스템을 부팅하고 시스템을 정상적으로 사용하는 것입니다. 이와 같이 우분투로 일시적으로 돌아와도 문제가 다시 발생하지 않으면 실제로 하드웨어가 손상되지는 않지만 나쁜 드라이버 나 잘못 구성된 커널과 같은 관련 항목 중 하나 일 가능성이 큽니다. 우분투와 같은 인기있는 배포판은 배포판의 테스트 단계에서 시도 된 많은 수의 기계로 인해 아치와 같은보다 안정적인 커널 구성을 가질 수 있습니다.


Ctrl-Alt-Delete는 init에 의해 처리되므로 커널이 여전히 작동하더라도 작동하지 않을 수 있습니다. OTOH AFAIR 커널은 패닉 후 SysRq 키를 기다리지 않습니다.
jpc

1
가능합니다. 사례를 구별하려면 파일을 넣으 ctrlaltdel hard십시오 /etc/rc.local. 시스템이 잠기면 Ctrl-Alt-Del을 시도하십시오. 그래도 아무 것도 수행하지 않으면 커널이 더 이상 실행되고 있지 않은 것입니다. 하드웨어 또는 드라이버 오류가 있습니다.
Warren Young

1
당황한데도 커널이 Magic SysRq 키에 응답하도록했습니다. kdump 서비스를 올바르게 설정하면 완전히 웨지 된 시스템이 kdump 커널로 부팅되므로 결국 다시 돌아와야합니다.
jsbillings

1
커널 키보드 처리 코드를 빠르게 살펴본 후에는 Ctrl-Alt-Del과 magic SysRq가 같은 수준으로 처리되는 것처럼 보입니다. 하나가 작동하면 다른 것입니다. init (1) / SIGINT 문제는 별개이며, 다른 의견에서 언급했듯이 Ctrl-Alt-Del 처리가 하드 재부팅을 수행하도록 설정하여 처리됩니다.
Warren Young

11

동결과 관련하여 몇 가지 옵션이 있습니다.

  • 당신의 상자를 추가하여이 덤프를 얻기 위해 하나가있는 경우 직렬 포트를 사용하여 console=ttyS0설명 된대로 부팅 옵션에 여기 . 덤프 파일을 포착하려면 직렬 포트와 널 모뎀 케이블이있는 두 번째 시스템이 필요합니다.

  • netconsole을 사용하여 네트워크를 통해 덤프를 가져 오려면 여기를 참조하십시오 .

  • 이 방법으로 kexec / kdump를 사용하면 로컬 덤프를 얻을 수 있습니다 (여기 참조) .

깨끗한 전원 끄기 문제와 관련하여 매직 SysRq 키 를 사용하여 디스크를 'S'ync하고'U '마운트 한 다음 상자를 다시'부팅하십시오 '(문자는 alt와 함께 입력 해야하는 문자입니다) -sysrq.

편집 : oops / trace를 lkml에 게시하는 경우 최신 모듈 (바람직하게는 최신 버전)의 커널을 사용해야하며 독점 모듈은 없어야합니다.


1
"시리얼 포트란 무엇입니까?" 사실, 나는이 기계가 하나도 없다고 생각합니다.
DarenW

몇 년 전에 SysReq에 대해 읽은 것을 기억합니다. 기계가 죽었을 때만 구글을 사용할 수 있다면! 두 번째 머신을 설정하는 것이 더 나을 것 같아요.
DarenW
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.