노트북이 정상보다 ~ 30 ° 더 뜨겁습니다. 보고 된대로 CPU /로드는 정상입니다. 이 원인은 무엇이며 어떻게 진단 할 수 있습니까?


10

ThinkPad t420 랩톱에서 최신 Arch Linux를 실행 중이며 온도가 일반적인 ~ 45 ° C에서 ~ 75-90 ° C로 상승하여 간헐적으로 열이 발생하여 재부팅 할 때까지 유지됩니다.

나는 명백한 등 여러 가지 진단 도구를 실행 한 htop을 포함하여 인터넷 검색을 제안했다고하고 다른 사람을 powertop, iostats확실히 내가 기억하지 않는 다른 사람을합니다. 지금까지 나는 명백한 문제가 없었으며, 내 컴퓨터가 정상적으로 작동하는지 또는이 핫 상태인지에 상관없이 판독 결과에 차이가 없었습니다.

또한 숨겨진 범죄자를 찾기 위해 가장 의심스러운 프로세스를 하나씩 (데이터베이스 및 기타 데몬) 하나씩 죽였습니다.

이러한 시도 외에도 문제 해결을 시작할 위치를 모르겠습니다 . 누군가가 더 깊은 문제를 찾기 시작하는 올바른 방향으로 나를 가리킬 수 있기를 바랍니다.

정확히 말해서, 내 질문은 내 기계를 식히는 방법이 아니라 CPU와 부하가 정상적 인 시스템에서 30도 이상의 열 변화를 일으키는 원인은 무엇입니까? 진단을 위해 어떤 도구 / 연습을 사용할 수 있습니까?

도움이 될만한 메모 :

  • 나는 (완전 팬 제어를 해제하여 예를) 시스템을 냉각하지만, 혼자있는 경우 즉시 다시 가열한다. 이것은 그 보온성이 문제가되지 않습니다 제안하는 것, 오히려 무언가가 지속적으로 열을 발생한다.
  • htop이 핫 상태에 들어가면 CPU 사용량과로드가 정상적으로 보고됩니다 . 여기에는 커널 스레드가 포함됩니다. 에 따르면 htop시스템은 기본적으로 유휴 상태입니다 (1-2 % 시스템 전체 CPU 사용량,로드 0.10).
  • 내 컴퓨터는 Intel HD 통합 그래픽을 사용하며 다른 그래픽 카드는 없습니다 . @braiam이 지적한 것처럼 nVidia 카드는이 모델의 옵션이었습니다. 나는 그것을 선택하지 않았다.
  • @terdon은 CPU 관리자 설정을 가져 왔습니다. 내 CPU는powersave
  • 내 특정 프로세서는 2.7GHz Core i7-2620M입니다.

편집 :이 질문을 쓸 당시 팬 제어 기능이 제대로 작동하지 않았으며 고온에서도 중간 RPM 범위 (3900 RPM)에서 지속적으로 실행되었습니다. @Alex와 @JustDanyul의 제안에서 이것은 수정되었습니다. 그러나 근본적인 문제는 여전히 남아 있습니다.


1
slm에서 알 수 있듯이 CPU가 유휴 상태이지만 코어 온도가 너무 높으면 가능한 한 설명은 어떤 이벤트 후에 과도한 열이 소산되지 않았다는 것입니다. 다음, 물을 끓여야 전체에 스토브 버너를 돌려 생각해 그 위에 뚜껑을 넣어 저 아래로 버너를 돌려 : 끓는 물에 남아 끊임없이 열 수없는이 증발 빨리 낮은 버너을 대체로 인해 만큼 뚜껑 에 있습니다. 그것이 나쁜 경우 그것을 분리하고 청소하십시오. 공기를 불어 넣으면이 시점에서별로 도움이되지 않을 것입니다.
goldilocks

공기 흐름에 문제가 있다고 생각되면 확실히 분해하고 청소할 것입니다. 그러나 CPU는 극단적 인 온도 변화를 일으키는 사건이 있더라도 일정하게 높은 온도를 유지합니다. 냄비에 뚜껑을 남겨 두어도 수온이 어느 정도 내려갑니다. 내 온도는 숫자에 부딪 히고 재부팅 할 때까지 영원히 그 숫자로 일관되게 유지됩니다. 서서히 열이 발생하지 않아 소산 문제가 있음을 시사합니다. 나는 아침 내내 전체 워크로드에서 실행되었으며 41도에 앉아 있습니다.
numbers1311407

달리 말하면 내 온도는 예상되는 스트레스 하에서 정상적으로 조절됩니다. 내가 열심히 컴파일을하면 60, 70도까지 가열 될 수 있지만 완료되면 냉각됩니다.
numbers1311407

팬 외에도 열 페이스트를 다시 적용 할 수 있습니다. 저렴한 열 페이스트는 시간이 지남에 따라 소실됩니다.
BlueRaja-대니 Pflughoeft

1
어쩌면 이것은 어리석은 질문이지만 ACPI를 비활성화 시켰습니까? 오래된 PC에서 비슷한 문제가 발생했습니다.이 옵션을 활성화 한 상태에서 부팅하지 않았으며, 비활성화 한 후 마침내 부팅되었지만 과열되었습니다.
Alko

답변:


6

필자는 Fedora 14를 실행하여이 작업을 수행합니다. 압축 된 공기 캔을 가져와 케이스 뒷면과 측면에 통풍구를 불어보십시오.

또한 주기적으로 키보드를 제거하고 팬 블레이드에 직접 압축 공기를 불어야합니다. 그들은 먼지와 함께 케이크를 바르고 무게를 줄임으로써 효과를 발휘하기 시작합니다.

Thinkpads의 가장 좋은 점은 서비스 매뉴얼입니다! 노트북을 분해하고 다시 조립하는 방법을 보여줍니다.

나쁜 과정

내가 주목 한 또 다른 것은 때때로 프로세스가 잘못되어 코어 중 하나의 100 %를 소비한다는 것입니다. 이 프로세스를 종료하면 일반적으로 온도가 정상으로 돌아옵니다.

당신은 사용할 수 있습니다 htop또는 top이것이 처리하는 것을보고 하나 그것의 사용하여 또는 터미널에서 죽일 PID.

또 뭐야?

랩톱의 다양한 구성 요소에 대한 온도 판독 값을 얻는 방법에 대한 자세한 내용은이 U & L Q & A에 대한 나의 답변을 참조하십시오. Q & A 제목 은 i3status에서 haswell i7 코어의 코어 온도를 얻는 방법 입니다.


이것은 분명히해야 할 일이지만 이상한 점은 때때로 핫 상태로 바뀌고 재부팅 할 때까지 지속되어 문제를 즉시 해결하는 이유 입니다. 지속적인 열 변화를 일으키는 무언가 가 일어나고있는 것 같습니다 . 나는 아무 소용이 없습니다 호프를 실행했습니다. CPU 사용량은 정상입니다.
numbers1311407

어쩌면 커널과 신호가 발생합니까?
Braiam

1
@ slm 감사합니다, 나는 그것을 시도하지 않았습니다. 다음 번에는 핫 실행을 시작하고 결과를보고 할 것입니다.
numbers1311407

1
@ numbers1311407 : 재부팅으로 문제가 빠르게 해결되는 이유는 온도가 차단 점 아래로 떨어지도록 몇 초 동안 CPU를 끄는 것입니다. "주변"이 무엇이든 CPU는 항상 주변보다 뜨겁습니다.
금발 미녀

1
top명령 에서 "1"을 눌러 개별 코어의로드를 볼 수 있습니다.
Christian Stewart '

3

이것은 더 긴 주석입니다하지만 당신은 한 번 봐해야 thinkwiki.org 그것이 씽크 패드에 리눅스를위한 자원. 온도는 t4500과 비슷한 문제가 있었고 함께 연주하여 분류했습니다.

  1. CPU 주파수 스케일링을 제어하는 ​​CPU 조정기입니다. 당신의 선택은 :

    • CPU를 최고 주파수로 유지하는 성능
    • 절전 은 CPU를 가능한 가장 낮은 주파수로 유지합니다
    • Userspace 는 사용 가능한 주파수 정보를 / sys 파일 시스템을 통해 사용자 레벨로 내보내고 CPU 주파수의 사용자 공간 제어를 허용합니다.
    • 온 디맨드 는 CPU 사용량에 따라 CPU 주파수를 스케일링합니다 (사용자 공간 주파수 스케일링 데몬과 비슷하지만 커널에서)
    • 보수주의 는 주문형처럼 작동하지만 단계적으로 빈도를 증가시킵니다.

    ondemand를 사용하면 CPU는 필요할 때 최고 속도로만 실행됩니다. 이상적으로, 이것은 당신에게 완전히 투명하며, 기계는 현재 작업에 필요한만큼 빨리 작동합니다. 그것을 활성화하려면

    sudo echo ondemand > /sys/devices/system/cpu/cpu0/cpufreq/scaling_governor
    
  2. 팬 제어. 팬 속도를 변경하는 트리거 온도를 미세 조정할 수있는 " Simple ThinkPad Fan Control " 이라는 매우 유용한 유틸리티 가 있습니다. 또한 여기에 있는 정보를 살펴보십시오 .


정말 도움이되었습니다. 나는 전에 그 위키를 우연히 만났지만 실제로 그것이 정확히 무엇인지는 기록하지 않았습니다.
numbers1311407

참고로, 내 모든 CPU는 다음에서 실행됩니다powersave
번호 1311407

1

나는 당신이 "핫"이라고 인식하는 것에 문제가 있다고 생각합니다. Thinkpad t420 ( 포럼에 따르면 )의 온도는 약 80-85 C이며 온도 상승의 원인이 될 수있는 nVidia 카드를 잊어 버릴 수 있습니다 (실제로 Optimus 구성이 제대로 작동하지 않아 CPU가 GPU를 작동하게합니다). 즉, CPU의 최대 허용 온도는 100C (시스템에 도달하면 시스템이 종료 됨)이고 분위기는 약 10.0 ° C에서 35.0 ° C 입니다. 즉, 랩톱이 범위 내에 있으면 배터리 및 랩톱 수명을 제외하고는 모두 정상입니다.

이제 당신은 가능한 용의자를 지적하고 싶었습니다. 이 측면에서 Linux를 사용하여 nVidia를 제대로 구현하지 않으면 악명 높은 On-Demand 시스템 Optimus로 인해 중지되지 않거나 CPU에 작업이 발생하지 않을 수 있습니다. 그것은 순간까지 잘 작동합니다. 제어없이 난방을 시작합니다). Bumblebee가 완전히 구성 될 때까지 설치를 업데이트해야합니다. 를 사용하여 bbswitchnVidia 카드를 마음대로 비활성화하고 어떻게 진행되는지 확인할 수 있습니다.

Bumblebee for Arch를 설치하려면 저장소에서 패키지를 찾을 수 있습니다. 여전히 설치하지 않은 경우


이 컴퓨터에서 nVidia 카드를 선택하지 않았습니다. 죄송합니다. 질문에서 더 명확해야합니다. 그리고 80-85는 너무 뜨겁지 않지만 여전히 40 대 중반보다 더 뜨겁습니다. 이것이 일반적인 컴퓨터 작업에서 보통 컴퓨터가 실행하는 것입니다. 내 문제는 어떤 팬텀 상태가 "시작"되는지 결정하려고하며 일관된 45가 일관된 80-85가되도록합니다.
numbers1311407

1

센서는 ~ 3900 RPM에서 팬이 윙윙 거리는 것을 보여줍니다.

~ 75-90 ° C와 같은 온도에서도?

수동으로 팬을 올리면 기계가 일시적으로 냉각됩니다

한 가지 문제는 팬 속도가 자동으로 작동하지 않는다는 것입니다.

자동을 잊어 버리면 온도를 정확하게 읽을 수 있으며 팬 속도를 수동으로 제어 할 수 있습니까? 그렇다면 팬 제어 스크립트를 찾거나 직접 롤아웃하는 temp[i]=speed[i]것만으로도 충분합니다 (온도를 폴링하고 테이블에 따라 속도를 설정하십시오). , 속도를 늦추어 야 할 때 속도를 천천히 늦추십시오.

폴링에 관해서는 열 변화 이벤트를 트리거하는 온도 모니터 데몬과 해당 이벤트를 수신 / 대기하는 팬 제어 스크립트를 사용하는 것이 가장 좋을 것 acpid입니다.

두 경우 모두 (자신의 스크립트 또는 기존 스크립트) 솔루션에 확신이없는 동안 온도와 RPM을 항상 주시하십시오. 팬이 멈추지 않아야합니다.

auto문제를 먼저 해결 하고 과열이 지속되면 원인에 초점을 맞출 수 있습니다.

편집하다

lttng시간이 지남에 따라 전체 시스템의 통계를 수집하는 것과 같은 도구를 사용하고 싶을 수도 있지만, 오랫동안 수집해야 할 경우 설정이 쉽지 않고 스토리지 측면에서 비용이 많이들 수 있습니다.


내 팬 컨트롤이 제대로 작동하지 않는 것이 맞습니다. 적절하게 응답하도록 노력할 것이지만 문제를 해결해도 근본 원인을 해결할 수는 없습니다. 나는 하루 종일 최대 6400ish rpm으로 느슨하게하고 조금 식힐 수 있지만 그 문제를 해결하려고합니다.
numbers1311407

1

팬을 수동으로 올리면 문제가 해결되므로 자동 팬 제어 기능이 작동하지 않는 것 같습니다.

자, 당신은 훌륭한 리눅스로 화려한 배포판 인 아치 리눅스를 실행합니다 (예, 나도 그것을 실행합니다). RTFM을 했습니까? ;피

https://wiki.archlinux.org/index.php/Lenovo_ThinkPad_T420#Fans

내가 볼 수있는 한 다음을 수행해야합니다.

  1. thinkpad_acpi 커널 모듈 활성화
  2. AUR에서 thinkfan 응용 프로그램을 설치 및 구성
  3. thinkfan 시스템 서비스 활성화

이 모든 것이 완료 되었습니까?

업데이트 행복한 매체에서 회전하는 것이 아니라 팬이 올바르게 작동하고 있습니다. (이것이 80도 이상의 온도에서 작동하는 기계의 문제를 해결했다고 생각합니까?)

30도 온도 변화의 근본 원인에 대한 답변과 관련하여 다음과 같은 질문을하고 싶습니다. 팬이 제대로 작동하지 않았기 때문일 수 없습니까?

그것을 가정하자.

  • 프로세서가 정상보다 열심히 작동하지 않습니다
  • 온도 변동이 이제 팬 속도 변동으로 대체되었습니다.

전혀 문제가 없을 수도 있다고 가정하는 것이 안전하지 않습니까? 문제는 단순히 팬이 간신히 대처할 수있는 수준에서 실행 중이라는 것입니까? 주변 온도 등의 작은 변화가 기능의 한계를 뛰어 넘습니까?

예를 들어, 나는 Acer 랩탑을 가지고 있었고, 따뜻한 날에는 팬이 "일관되게"회전하고있었습니다. 팬이 실제로 자체 조정을 할 수 없다면 내 온도 변동이 상당히 커졌을 것입니다. :)


방금 thinkfan을 설치했습니다. 머리를 숙여 주셔서 감사합니다. 예, 자세한 아치 위키는 배포판의 큰 특권입니다. 나는 수천 번 거기에 있었지만 절대 우연히 만났거나 내 정확한 모델 전용 페이지를 찾는 것으로 생각했으며 thinkfan이 언급되지 않았습니다. 좋은 작은 스크립트. 즉, 이것은 실제 문제를 해결하지 못합니다. 비정상적으로 높은 온도의 원인을 어떻게 진단합니까? 팬 컨트롤을 풀고 최대 RPM에서 느슨하게 자르더라도 미스터리 열의 실제 문제에 반창고를 씁니다.
numbers1311407

아니요, 문제는 여전히 변하지 않습니다. 나는 지금 여기 42도에 앉아 있습니다. 내 열 상태가 발생하면 동일한 프로세스를 실행하고 주변 환경은 동일하며 표면적으로 아무것도 변하지 않지만 온도는 일관된 42에서 일관된 75+로 상승합니다. 나는 , 노트북 쿨러에 넣어 6500 RPM 등으로 스핀을에 허용 fancontrol를 해제하지만 정지하는 경우, 그것은 75 + 바로 백업을 열 수 있습니다 : 그것을 냉각. 최대 속도의 팬은 어쨌든 약간 더 빠릅니다. 그것을 고치는 것은 좋지만 근본적인 문제에 대한 해결책은 아닙니다.
numbers1311407
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.