이중 CPU 서버에서 한 CPU가 다른 CPU보다 더 뜨겁게 실행되는 것은 정상입니까?


51

libvirt와 함께 Linux를 실행하여 여러 VM을 호스팅하는 이중 Opteron 서버가 있습니다. VM은 정상적으로 작동하고 서버는 정상적으로 처리하지만 하나의 CPU는 항상 약 69C (70C의 스로틀)에서 실행되고 다른 CPU는 약 15C에서 실행됩니다.

이것은 나에게 평범하지 않은가? 둘 다 온도가 조금 더 가까워서는 안됩니까?

더 이상 이완시키는 방법을 모르겠습니다. CPU 중 하나에 열 페이스트가 충분하지 않습니까?

편집 : 메인 보드는 ASUS KGPE-D16 이며 듀얼 Noctua NH-U9DO 팬으로 냉각됩니다 .

온도가 절대 값이 아닌 주변 온도보다 높을 수 있다고 생각합니까? 서버가 유휴 상태이면 CPU 온도가 2C 및 13C로 떨어집니다. 여기 에서 lmsensors 구성을 사용하고 있습니다


1
서버 제조업체 / 모델이란 무엇입니까?
ewwhite

2
CPU로드 분배는 어떻습니까? mpstat -P ALL 1리눅스에서 도움이 될 것입니다
Christopher Perrin

3
온도 센서가 고장난 것 같은 소리
matcheek

14
15C는 아마도 깨진 검열 일 가능성이 높다 ....
Reaces

서버가 재부팅 될 수있는 경우 센서가 고장 나거나 잘못 보정 된 것 같습니다. 올바른 값을 표시해야하는 BIOS를 살펴보십시오.

답변:


106

문제는 히트 싱크에 맞지 않는 결과를 낳았습니다. 아마도 잘 맞지 않는 것이 올바른 설명이 아닐 수도 있습니다. 방열판을 덮는 플라스틱 덮개가 아니라 방열판에 열 페이스트를 넣어야합니다.

여기에 이미지 설명을 입력하십시오

플라스틱 덮개를 제거한 후 CPU는 훌륭하고 시원합니다. 여러분 감사합니다!


51
재미 있기 때문에 +1
HBruijn

9
플라스틱 덮개를 제자리에두고 붙여 넣은 다음 방열판을 씌운다는 의미입니까? 서사시.
TomTom

4
Baaaaaahaaahaaahahahaa !!
Craig

8
이용 약관, 제한 보증 및 반품 정책을 백그라운드에서 확인하는 방법이 마음에 듭니다. :)
Monica와의 가벼움 경주

6
그것이 당신이 덜 어리석은 느낌을 느끼게하고 (그리고 그렇지 않을 경우), 나는 새로운 사무실 커피 메이커와 비슷한 일을했습니다. 커피를 마시기에는 너무 차가워서 보호용 골판지 디스크가 발열체에서 떨어지기 전에 상점으로 돌아 가기 위해 다시 포장했습니다 :)
Martin James

25

필자의 경험에 따르면, 공기 흐름이 모든 곳에서 동일하지 않기 때문에 케이스에서 페어링 된 구성 요소가 다른 온도에서 작동하는 것이 일반적입니다. 여기 내 콜로 박스의 HDD 온도 그래프가 있습니다. 드라이브가 미러링되므로 워크로드가 거의 동일합니다.

지난 해 HDD HDD의 munin 그래프

보시다시피, 그들은 서로를 추적하지만 동일하지 않습니다. 또한 평균적으로 6C 만 떨어져 있습니다. 센서가 절대 온도 또는 과열을보고하든 부하 상태에서 55C의 차이는 매우 잘못되었습니다. 데이터가 옳다고 확신한다면 대기 흐름으로 인해 나타나는 차이 인 대기 온도 차이가 10C로 떨어지면 히트 싱크가 제대로 장착되지 않은 것 같습니다.


1
mpstat (Christopher Perrin의 감사합니다!)를 사용하여로드가 상당히 고르게 분포되어 있음을 확인했습니다. + 3C와 + 20C에서 현재 유휴 상태입니다. 방열판이 느슨하지 않은지 확인하려고합니다. 열 페이스트 문제 일 수 있다고 생각하십니까?
samoz

그것은 매우 가능합니다 (더 흔들기 시작한 후에도 가능합니다).
MadHatter

8

그렇지 않습니다. 공기 흐름에 심각한 문제가없는 한. 아니면 쿨러 중 하나가 나쁩니다. 온도는 다양하지만 그다지 크지 않습니다 (섭씨 70도에서 15도).

15도 정도의 낮은 온도를 감안할 때 (a) 센서가 꺼져 있습니다 (서버를 실제로 시원한 방에 보관하십니까?).

또한 어떤 이유로 든 CPU 중 하나가 전혀 작동하지 않는다고 가정합니다.

작은 차이는 정상입니다. 조금 더 큰 것들이있을 수 있습니다 (기류가 떠 오릅니다). 그러나 여기서 우리는 하나의 콜드에 대해 이야기합니다.


2

냉각 또는 고르지 않은 로딩 일 수 있습니다 (상황이 고르지 않은 온도 차이 일 경우). 모든 코어를 균등하게로드하고 온도가 여전히 다른지 확인하려면 prime95와 같은 것을 사용해야합니다. 그렇지 않은 경우 VM의 균형을 조정해야하는 경우 앱이 멀티 스레드되고 사용량이 많은지 확인하십시오. 이를 수행하는 방법은 소프트웨어 및 개별 워크로드에 따라 다르므로 문제의 범위를 벗어납니다. 단일 CPU / 코어를 완성하기에 충분한로드가없는 경우 실제로 VM이 두 번째 CPU 사용을 피하여 멀티에서 절전 모드로 전환 할 수 있다는 점을 명심하십시오. -cpu 시스템.

냉각으로 좁힌 경우. 최대 10C의 작은 차이는 열 페이스트가 너무 적거나 너무 많을 수 있습니다. 더 큰 차이는 CPU 쿨러 간의 중요한 문제 또는 차이를 나타냅니다. 공기 흐름이 막혔거나 방열판이 느슨해 졌을 수 있습니다.


0

나는 불완전한 온도와 동의해야 할 것이다. 15C는 59F이므로 센서! 컴퓨터가 매우 혹독한 데이터 센터에 있지 않다면 주변 공기 온도가 59F보다 높을 것입니다! VM을 저온 코어에 할당하고 변경 사항이 있는지 확인하십시오. 그렇지 않다면 센서에 결함이있는 것으로 의심됩니다.

dmesg(부팅 메시지) 의 출력을보고 평범하지 않은 것이 있는지 확인할 수도 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.