CPU가 단일 썸네일에있는 수십억 개의 트랜지스터라는 것을 알고 있습니다. 트랜지스터 중 하나가 고장 나면 어떨까요?
CPU에 자동 복구 메커니즘이 있습니까?
CPU가 단일 썸네일에있는 수십억 개의 트랜지스터라는 것을 알고 있습니다. 트랜지스터 중 하나가 고장 나면 어떨까요?
CPU에 자동 복구 메커니즘이 있습니까?
답변:
간단합니다. 판매하기 전에 테스트하고 나쁜 것을 버립니다.
이 작업을 수행하는 많은 방법이 있습니다. 다른 사람들이 다른 일을하고 종종 다음 조합을 사용합니다
일부 테스트는 빠르게 진행되도록 속도가 빠릅니다.
다른 테스트에는 칩의 일부 또는 모든 플립 플롭을 거대한 직렬 시프트 레지스터로 변환하는 모드가 포함되어 있습니다. 알려진 데이터를 해당 체인에 클록 한 다음 칩을 한 클록으로 실행 한 다음 새로운 결과를 다시 스캔하여 일치하는지 확인합니다. 당사의 예측 결과-자동 테스트 툴은 칩의 모든 랜덤 게이트 또는 트랜지스터를 테스트하는 최소 "스캔 벡터"세트를 생성합니다. 다른 벡터는 램 블록에 대한 특수 테스트를 수행합니다.
다른 사람들은 외부 전선이 모두 올바르게 결합되었는지 테스트합니다.
우리는 그것이 건강에 해로운 양의 전류를 당기지 않도록합니다
테스트 시간은 비용이 많이 들며, 때로는 불량 칩을 폐기하기 위해 포장하기 전에 명백한 죽은 칩에 대한 간단한 테스트를 수행 한 다음 포장 완료 후 더 많은 테스트를 수행합니다.
다른 사람들의 말을 조금 더 확장하려면 : 검증이 있고 그 후에 칩 분류가 있습니다.
CPU의 트랜지스터는 더 높은 주파수에서 문제를 나타내는 경향이 있으므로 하나의 CPU를 만든 다음 여러 다른 제품으로 판매하는 것이 일반적입니다. 더 저렴한 CPU는 실제로 비싼 CPU의 손상된 버전입니다. 다른 옵션은 CPU의 특정 부분을 비활성화하는 것입니다. 예를 들어, AMD는 BArton 코어로 프로세서를 만들었습니다. Thorton 코어가 장착 된 프로세서도 판매했습니다. Thorton은 새로운 핵심이 아니 었습니다. 대신 L2 캐시의 절반에 결함이 있고 비활성화되었습니다. 이런 식으로 AMD는 다른 방식으로 낭비되었던 CPU를 일부 복구했습니다.
AMD의 3 코어 프로세서에서도 마찬가지입니다. 원래 4 개의 코어 프로세서 였지만 코어 중 하나에 결함이있는 것으로 확인되었으므로 비활성화되었습니다.
귀하의 질문에 대한 답변은 "아니오"입니다. 현재 하드웨어 장애에 대한 자동 복구 방법은 없습니다.
제조업체는 웨이퍼에서 가능한 최고의 수율 (달러)을 얻기 위해 프로세스를 설계합니다. 트랜지스터를 축소함으로써 더 많은 영역에 더 많은 기능을 적용 할 수 있습니다. 이것은 웨이퍼 당 더 많은 칩 (동일한 기능)으로 생각할 수 있습니다. 칩 크기가 줄어들면 웨이퍼에서 더 많은 것을 얻을 수 있지만, 줄어들면 더 많이 나빠집니다. 제조사들은 이것을 받아들이고 칩을 축소하기 위해 기술의 한계를 끊임없이 밀고있다. 그들이 봉투의 가장자리에 있다고 말하는 것은 불량 칩입니다.
회사가 피처 크기를 기존 피처 크기의 70 %로 축소 할 수 있으면 웨이퍼 칩 수의 약 2 배를 얻을 수 있습니다. 이전 프로세스의 수율이 95 % (예 : 웨이퍼의 100 개 중 95 개 칩 칩)와 새 프로세스의 수율이 75 % (웨이퍼의 200 개 중 150 개 칩)이면 돈을 벌 수 있습니다. 새로운 과정.
작은 노드에서 SRAM과 같은 메모리가 없으면 각 "트랜지스터"는 2 개의 게이트입니다. 작동하지 않으면 드라이버가 느리다는 것입니다. SRAM의 경우 통과하지 못하면 행을 "블로우"만하면됩니다. 트랜지스터의 FET가 모두 고장 나면 모래가 매우 비싸지 만 개인적으로는 그런 일이 없었습니다. 현대 FinFET는 매우 작으며, 리소그래피 및 확률의 특성으로 인해 많은 생산 문제 (주로 번거 로움)가 있습니다. 불량 셀을 "블로우 (blow)"하고 라우팅 그래프를 변경할 수 있기 때문에 새로운 프로세스에서 가장 먼저 FPGA를 찾을 수 있습니다. 나는 당신에게 숫자를 줄 수는 없지만 x86 세계가 비닝하는 방식으로 추측 할 수 있습니다.
왼쪽 / 오른쪽 녹색 막대는 지느러미이며 빨간색은 폴리입니다. 파란색은 레벨 1의 유색 금속입니다.
상용 CPU에는 자동 복구 메커니즘이 없지만 학계 및 특수 응용 프로그램 CPU에 떠있는 것들이 있습니다. 비동기 아키텍처를 사용하여 게이트가 잘못되어 발생하는 클럭 문제를 해결하기 위해 특수한 구성 요소를 만들었습니다. 단지 느린 트랜지스터를 얻는 핫 캐리어로 구멍의 산화물을 파괴합니다.
분명히 시간이 변경되었습니다. 이 질문에 대한 5 살짜리 답변 중 많은 부분이 더 이상 예술의 상태를 반영하지 않고 일부는 정확하지 않았습니다.
IC가 과열되지 않는 경우 실리콘의 트랜지스터 및 기타 장치는 제조 후 상당히 안정적입니다.
결함을 최소화하기 위해 현대 IC 제조 공정에서 수행되는 작업은 다음과 같습니다.
프로세서의 공식 사양에서 프로그래밍 오류는 특정 트랜지스터의 오류보다 더 가능성이 높습니다.
일반적인 CPU에는 자동 복구 기능과 같은 것이 없지만 자체 재설정 CPU에 대한 작업 도 있습니다. 우주 광선에 대한 대책으로 . 우주 광선은 CPU 또는 RAM에 충분한 에너지를 축적하여 비트 충돌을 일으킬 수 있습니다.
의견에서 지적했듯이 미션 크리티컬 시스템은 오랫동안 검증을 위해 여러 CPU에 의존했습니다. 우주 왕복선, 1976 년 다시는 , 하나의 예로서, 같은 프로그램을 실행하고 안전을 보장하기 위해 모든 비행 제어 결정에 "투표"네있는 5 대의 컴퓨터를 사용했다.
대부분의 최신 프로세서 트랜지스터는 FET입니다. 이것들은 과부하를 시작할 때 소스 / 드레인 저항을 얻는 이점이 있습니다. 이는 많은 병렬 처리를 통해 고전력 MOSFET을 만들 수있는 한 가지 요소입니다. 하중이 자동으로 분배됩니다. 문제를 배포하는 데 도움이 될 수 있습니다. 그러나 나는 그것이 그보다 훨씬 간단하다고 생각합니다.
대부분의 전자 부품과 마찬가지로 사양 내에서 운전하면 꽤 오래 지속됩니다. 마이크로 프로세서를 만들 때 비용에는 두 가지 요소가 있습니다. 실리콘상의 공간과 복잡성 때문에 실제 수율. 제조 후 모든 칩이 작동하는 것은 아닙니다. 그러나 일단 검증이 완료되면 트랜지스터가 양호하다는 것을 알 수 있습니다. 사양 내에서 추진된다면, 그들이 좋은 상태를 유지할 가능성이 있습니다.
왜 같은 칩이 때때로 다른 속도로 판매되는지 궁금한 적이 있습니까? 때로는 동일한 GPU 칩 아키텍처가 다른 수의 내부 장치와 함께 판매되는 것을 보셨습니까?
실리콘 수준에서 하드웨어 결함을 고치는 방법은 없지만 시간이 지남에 따라 설계자들은 수율 을 높이는 문제를 해결하는 방법을 배웠다 . 예측없이 생산량은 전적으로 제조 품질에 달려 있습니다. 그러나 영리한 사람이라면 불량 칩을 복구 할 수 있습니다.
예를 들어, 독립적으로 작동하는 18 코어 칩 설계가 있다고 가정 해 봅시다. 테스트하는 동안 완벽한 칩을 분류하여 A18 모델로 출시합니다. 대부분의 실패한 칩에는 하나의 오류 만 있으므로 결함이있는 코어가 비활성화되어 있으면 제대로 작동합니다. 약간 낮은 가격으로 A17 모델로 판매하고 불량 코어가 2 개인 제품은 A16 모델로 판매됩니다.
칩의 속도 등급에도 동일하게 적용될 수 있습니다. 완벽하게 제조 된 칩은 설계 사양 이상의 속도로 작동 할 수 있지만 문제가있는 칩은 그렇지 않을 수 있습니다. 이들은 저속 사양으로 판매됩니다.
이 방법은 전체 수율을 극적으로 증가 시키므로 일반적으로 볼 수 있습니다. 예를 들어 PlayStation 3에는 하드웨어에 8 개의 SPE 장치가 있지만 수율 문제를 해결하기 위해 항상 비활성화되어 있습니다.
일반적으로 아니오, 칩 스크린을 통해 불량 트랜지스터를 덮으면 그 후에 비교적 적은 비율의 손실이 예상됩니다. 칩 사업은 수십 년 동안이 기술을 관리하기위한 많은 트릭을 가지고있었습니다. 때로는 트릭 중 하나는 불량 부품을 꺼내어 무료로 교체하거나 고객을 불행하게 만드는 것입니다.
방사선 경화 환경 (공간)의 경우 트리플 투표일 가능성이 높습니다. 모든 "비트"에는 실제로 하나를 만들기 위해 투표하는 3 개의 비트가 있습니다. 비트 설정을 결정하는 데 2/3 만 걸립니다. 다른 3 분의 1의 트랜지스터는 나빠질 수 있으며 결국에는 총 용량으로 처리됩니다. 그러나 가장 큰 관심사는 단일 이벤트에 대한 불만입니다. 이러한 칩과 시스템은 위에서 아래로, 실리콘, 하드웨어, 소프트웨어 등에서 이러한 환경에 맞게 설계되었습니다. 또한 첨단 기술이 아닌 오래되고 검증 된 기술을 사용하므로 트랜지스터의 수와 크기는 몇 년 전부터있었습니다.
COTS는 때때로 딸꾹질을하며 실패합니다.