GPU를 고온에서 실행하는 것이 카드에 좋지 않다는 것을 증명할 수 있습니까?


11

80 ° C ~ 90 ° C (176 ° F ~ 194 ° F)에서 그래픽 카드를 계속 실행하면 실제로 그래픽 카드에 좋지 않습니까? 즉, 카드 수명이 단축됩니까? 이것이 증명 될 수 있습니까? 아니면 그냥 가정입니까?

GPU의 안전 차단은 일반적으로 90 ° C (194 ° F)입니다.


'안전 차단'은 온도가 측정되는 위치와 회로가 설계된 프로세스 및 최대 온도에 따라 달라집니다. 특정 세대의 인텔 CPU의 최대 정격 온도는 110 ° C였습니다. 칩이 스스로 파괴 될 것이라고 생각했기 때문에 특정 하드웨어에 대한 걱정이있었습니다. 스포일러 : 그렇지 않았습니다.
Joren Vaes

1
나는이 질문이 다른 질문 ic-product-lifetime-as-function-of-junction-temperature 와 관련이 있다고 생각합니다 . 이 질문의 결론은 실온보다 높은 15 ° C마다 IC의 수명이 절반으로 단축된다는 것입니다. 따라서 80 ° C와 비교하여 90 ° C에서 그래픽 카드를 실행하면 수명이 ~ 37 % 감소합니다 (80 ° C에서 수명이 8 년이면 대신 90 ° C에서 5 년입니다)
Harry Svensson

1
Arhennius Law는 MTBF / 10'C 상승률이 50 %에 가깝지만 1000 h @ 85h 또는 105h와 같이 훨씬 낮은 MTBF로 시작하는 유전체에 대해 고려해야 할 다른 요소가 있으므로 105'C 정격 캡 또는 보다 나은.
Tony Stewart Sunnyskyguy EE75

답변:


21

고장 메커니즘을 연구하고 그것이 열에 의해 어떻게 영향을 받는지 봅시다. 고장 메커니즘이 온도에 따라 더 빨리 발생하기 때문에 GPU가 반드시 더 빨리 고장 나지는 않는다는 것을 기억하는 것이 매우 중요합니다! 상온에서 100 년 동안 지속되는 하위 구성 요소가 뜨거울 경우에만 20 년 동안 지속되지만 다른 하위 구성 요소는 1 년 동안 만 지속되어 열에 영향을받지 않는 경우 제품 수명은 거의 변하지 않습니다. 온도.

Simeon이 말한 자전거 문제는 무시할 것입니다. 이것이 내 전문 지식이 아닙니다.

보드 레벨에서 나는 머리로 '파손'할 하나의 주요 구성 요소 인 전해 커패시터를 생각할 수 있습니다. 이러한 커패시터는 건조되며 열이 가해지면 더 빨리 건조된다는 것을 잘 알고 있습니다. (탄탈륨 커패시터는 수명이 짧아 지지만 열에 따라 어떻게 변하는 지 모르겠습니다).

그러나 실리콘은 어떻습니까?

여기에 내가 이해하는 것처럼 실패를 일으킬 수있는 몇 가지가 있습니다. 여기서 주요한 것 중 하나는 전자 이동입니다. 회로에서, 금속 조각을 통과하는 전자는 실제로 물리적으로 원자 주위를 이동할 것입니다. 이것은 너무 나빠서 도체에 틈이 생겨 고장을 일으킬 수 있습니다.

이 이미지는 좋은 설명을 제공합니다 (Tatiana Kozlova, Henny W. Zandbergen; Ni nanobridge의 일렉트로 마이그레이션의 현장 TEM 관찰) :

여기에 이미지 설명을 입력하십시오

이 공정은 온도에 따라 기하 급수적으로 증가하므로 온도가 높고 일렉트로 마이그레이션이 고장의 주요 원인 인 경우 칩의 수명이 줄어 듭니다.

또 다른 메커니즘은 회로 내에서 트랜지스터가 게이트 펀치 스루를 겪는 산화 파괴입니다. 또한 온도에 따라 다릅니다. 그러나 여기서 전압은 훨씬 큰 영향을 미칩니다.

도펀트의 드리프트 또는 핫 캐리어 주입으로 인한 VT 시프트도 있습니다. 온도에 따라 도펀트 드리프트가 증가합니다 (그러나 매우 느린 프로세스이므로 디지털 회로의 경우에는 문제가되지 않습니다). 나는 핫 캐리어 주입의 온도 의존성에 대해 확신하지 못하지만 여기서 전압이 훨씬 더 중요한 요소라고 생각합니다.

그러나 중요한 질문이 있습니다 : 이것이 수명을 얼마나 줄입니까? 이것을 알고 있으면 그래픽 카드를 항상 시원하게 유지해야합니까? 디자인 단계에서 오류가 발생하지 않는 한 내 추측은 아니오입니다. 회로는 최악의 상황을 염두에두고 설계되었으며 제조업체의 정격 수명 한계에 도달 할 경우 회로가 지속되도록 설계되었습니다. 사람들이 오버 클럭킹 회로의 경우 : 회로를 안정적으로 유지하기 위해 자주 사용하는 전압의 증가 (회로 속도를 약간 높일 수 있음)는 온도 자체보다 훨씬 더 해를 끼칩니다. 또한 전압이 증가하면 전류가 증가하여 일렉트로 마이그레이션 문제가 크게 가속화됩니다.


2
그것들은 환상적인 이미지입니다. 저는 항상 일렉트로 마이그레이션이 실제로 어떻게 보일지 궁금했습니다.
커서 키

9

그렇습니다 . 열이 전기 부품을 손상시키는 것으로 입증 되었습니다 . 금속은 가열 될 때 팽창하고, 땜납 (전기 회로 연결에 사용됨)은 금속 합금이므로 가열 될 때 팽창합니다. 지속적인 가열 및 냉각은 조인트가 지속적으로 팽창 및 수축하여 균열 및 조인트 파손을 초래할 수 있습니다.

                                                      고장률 대 온도 그래프

그래프Arrhenius'Law 가 열 증가와 반도체 고장 사이의 상관 관계를 제공하는 방법을 보여줍니다 . 이 백서 에서는 전자 부품에 대한 열의 영향에 대해 자세히 설명합니다. 내 지식 범위를 벗어난 전자 수준의 것들을 더 다루고 있습니다.


1
팽창과 수축으로 말하면 사이클링이 좋지 않다고 생각할 수 있지만 항상 높은 부하에서 작동하는 데 문제가있어서 온도가 항상 높 습니까?
콜린

저는 IC 디자이너이므로 보드 수준의 고장 모드에 대해 거의 알지 못하지만 항상 취미로 물건을 수리하는 경우 확장 사이클로 인해 고장이 발생하지 않았으므로 얼마나 중요한지 의문을 제기해야합니다. 다른 메커니즘과 비교됩니다.
Joren Vaes

1
@Colin "항상 고부하"와 같은 것은 없습니다. 예를 들어 GPU에서 비트 코인을 채굴하지 않는 한 다른 것보다 더 많은 부하가있는 시간이 있습니다. GPU에서 냉각이 상당히 강력해야하기 때문에 이미 언급 된 문제가 발생합니다. XBox ring of death를 참조하십시오.
Marcus Müller

@ MarcusMüller는 절대적으로 있습니다. 그리고 하중이 절대적으로 일정하지 않다는 것은 중요하지 않습니다. 사이클링을 위해서는 델타 온도가 중요합니다. 설계된 온도 내에서 95-100 % 부하 (예 : 계산)에서 99 %의 시간을 실행하는 카드는 0 %에서 100 % 사이의 50 %에서 진동하는 동일한 카드보다 가상 사이클링 손상에 훨씬 덜 민감합니다. if (즉 게임).
Dan M.

6

반도체 접합 온도의 증가와 MTBF (Mean Time Between Failure)의 감소 사이의 관계는 잘 알려져 있습니다.

Micron의 기술 노트는 이에 대해 이야기합니다.

실제로, 접합 온도가 ~ 125 ° C를 초과하면 고장률이 기하 급수적으로 증가하므로, 온도보다 낮게 작동하는 경우 작은 증분이 그렇게 중요하지 않을 수 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.