CPU 제조업체가 왜 프로세서의 클럭 속도 증가를 멈췄습니까? [닫은]


63

제조업체가 더 높은 클럭 속도에 집중하는 것을 중단했으며 현재 성능 개선을 위해 다른 작업을하고 있습니다.

  • 3.0GHz의 클럭 속도를 가진 인텔 ® 제온 ® 프로세서 E3110이 장착 된 이전 데스크탑 시스템
  • 2.1GHz 클럭 속도의 AMD Opteron ™ 프로세서 6272가 장착 된 새로운 서버

(단일 스레드)를 사용하여 간단한 암호화 비교를 수행하는 경우

 openssl aes256c

데스크탑은 서버보다 훨씬 뛰어납니다.

최신 최적화를하더라도 클럭 속도가 더 좋은 프로세서가 더 나은 성능을 보이는 이유는 무엇입니까?


57
데스크탑 칩은 듀얼 코어입니다. 서버는 16 코어 CPU입니다. 단일 스레드 벤치 마크를 사용하는 것은 전혀 적합하지 않습니다.
MSalters

@learner-프로세서의 속도는 필요한 전압의 양을 늘려도 증가 할 수 없으므로 열을 줄입니다. 전력 소비량에 집중함으로써 그들은 미래에 프로세서 속도를 증가시킬 수있을 것이다.
Ramhound

1
사과와 오렌지를 비교하지 않고 실제 '제조업체' '감소'클럭 속도의 사례를 인용하거나 질문 제목을 '증가하지 않음'으로 제한하십시오.
Jan Doggen

8
K6 / 펜티엄 시절 이후 AMD와 인텔의 클럭 속도는 공평하지 않았습니다. AMD는 코어 클럭이 각각 1.8 또는 2.1 일 때 Athlon 프로세서를 2500+ 또는 3000+로 판매했지만 일반적으로 진정한 2.5 또는 3GHz 클럭을 한 인텔 칩으로 벤치마킹했습니다. 단순히 있습니다 방법은 클럭 속도에 단순히 비교를 위해 지금 아키텍처 사이 너무 많은 차이가.
KeithS

답변:


72

제조업체가 클럭 속도를 높이는 데 집중하지 못한 이유는 더 이상 프로세서를 더 빨리 식힐 수 없기 때문입니다. 클럭 속도가 높을수록 더 많은 열이 발생하며 이제 냉각에 들어가는 에너지 양으로 인해 프로세서 속도를 높이는 데 더 이상 효율적이지 않은 단계에 도달했습니다.

다른 답변은 클럭 속도가 어떻게 모든 영역에서 더 나은 성능을 의미하지는 않는지에 대해 자세히 설명합니다.


1
+1이 벽에 부딪히자 마자 내 컴퓨터를 구입 한 것 같습니다. 8 년 된 P4 3.4GHz는 아마도 대부분의 시장을 볼 때 클럭 속도 측면에서 가장 빠릅니다 (OC가 아닌 경우).
Karthik T

2
전력 소비도 문제가 될 수 있습니다. 16 코어 3.0GHz를 사용한다면 아마도 200+ 와트를 소비 할 것인데, 가장 일반적인 전원 공급 장치는 나머지 시스템과 함께 거의 지원할 수 없습니다.
Mixxiphoid

9
@Mixxiphoid 또한 회로에서 처리 할 수있는 전압에서 어떻게 든 200 + W를 CPU로 가져와야합니다. 그것은 그 자체로 사소한 작업입니다.
CVn

1
CPU 클럭을 높이려면 파이프 라인을 늘려야하지만 코드를 포크하고 컨텍스트를 변경하고 메모리를 점프하거나 지우면 전체 파이프 라인을 지우고 다시 채워야합니다. 그 명령에 대한 결과이므로 파이프 라인과 CPU 주파수를 줄이는 것이 좋습니다. 따라서 포크, 컨텍스트 변경, 점프해야 할 때마다 파이프 라인을 다시 채우기 위해 오랜 시간을 기다릴 필요가 없습니다.
Lefsler

1
@demonofnight : "매번 점프 할 필요가있을 때마다"라고 말하기에는 너무 많은 일이다. 무조건 직접 분기는 제어 위험이 없으므로 조건부 분기를 제외하지 않습니다. 다양한 기술 (SPEC 기반의 일부 용지를 기반으로 한 데이터)에 의해 ~ 95 % -99 %가 예측됩니다. 대상이 아직 등록되지 않았고 잘못 예측 한 경우 직접 분기에서 문제가 발생합니다. '코드 포크'또는 '메모리 지우기'가 무슨 뜻인지 잘 모르겠지만 컨텍스트 스위치를 너무 자주 실행해서는 안됩니다 (중단 및 I / O).
Maciej Piechotka

37

처리 속도에는 클럭 속도보다 훨씬 많은 것이 있습니다.

  • 파이프 라인 배열의 변형이 다르고 각 코어에 여러 구성 요소 단위 (가산기 등)가 있기 때문에 서로 다른 CPU는 동일한 수의 클럭주기에서 다른 양을 수행 할 수 있습니다. 테스트에서는 그렇지 않지만, "더 느린"칩은 틱당 더 많은 작업을 수행 할 수 있기 때문에 빠른 칩보다 더 많은 것을 할 수 있습니다 (클럭 속도로만 측정).

  • 수행 한 테스트는 CPU 아키텍처의 차이에 매우 민감 할 수 있습니다. 특정 아키텍처에 최적화 될 수 있습니다. 인텔 칩과 AMD 칩뿐만 아니라 다른 제품군의 인텔 (또는 AMD) 칩간에 다르게 수행되는 것을 알 수 있습니다. 단일 스레드를 사용할 수도 있으므로 CPU의 다중 코어를 활용하지 않습니다.

  • 전력 및 열 관리 이유로 클럭 속도를 낮추는 방법이 있습니다. 클럭 속도를 높이는 것은 전력 사용 및 열 출력에 선형 영향을 미치지 않습니다.

  • 위의 비선형 관계로 인해 오늘날의 요구 사항에서 하나의 장치 속도를 높이는 것보다 여러 처리 장치를 갖는 것이 훨씬 효율적입니다. 또한 사용하지 않을 때 개별 코어를 끄고 수요가 다시 증가함에 따라 다시 복구하는 등 영리한 트릭을 통해 전력을 절약 할 수 있습니다. 물론 여러 코어가 단일 스레드 알고리즘을 지원하지는 않지만 동시에 두 개 이상의 인스턴스를 실행하는 경우에는 도움이되지 않습니다.


그렇다면 클럭 속도와 전력 사용의 관계는 무엇입니까?
user84207

$ P = CV ^ 2f $. 당신은 또한 이것을 읽을 수 있습니다 .
zakkak

19

제조업체가 실제로 두 프로세서 만 비교하여 클럭 속도를 낮추고 있다고 생각하는 이유는 무엇입니까?

  1. 6272는 3GHz로의 터보 속도를 가지고있다. 낮은 기본 속도는 평균 와트 수를 낮추고 모든 코어에 스트레스가 가해지면 워크로드에 허용되는 TDP를 유지하기위한 것입니다.
  2. 데스크탑 용 AMD의 차세대 고성능 칩 FX-9590 은 5Ghz에 도달 할 것입니다.

또한 클럭 속도는 클럭주기 당 성능과 다릅니다. i7-3930K에서 3.8Ghz P4 대 3.2Ghz 코어 하나를 사용할 수 있지만 이것이 P4 코어가 더 빠르다는 것을 의미하지는 않습니다.

여기에서 언급 한 모든 전력 소비량은 TDP 문제에 대해 자연스럽게 더 많은 관심을 가져야하는 16 코어 설계에서 완벽하게 유효하며 사실입니다.

또한 openssl을 테스트하는 벤치 마크 방법은 실제 숫자를 제공하는 데 약간 간단합니다. 어쩌면 암호화 벤치 마크 제품군을 사용해보십시오.


3
클럭 속도 = 성능 오류와 유사합니다. 한 사람이 아주 작은 단계를 밟지 만 매우 빠른 속도 (높은 클럭 속도)를, 다른 사람이 약간 느린 속도 (낮은 클럭 주파수)로 큰 단계를 밟는다 고 상상해보십시오. 큰 발걸음을 내딛는 사람은 훨씬 빨리 움직일 수 있습니다.
Martin Konecny

@MartinKonecny ​​: 훌륭한 시각화!
자크 사용 Latta

2
@MartinKonecny ​​내 이해는 대부분의 어셈블러 명령어 (ADD, MOV, IMUL 등)가 단일 사이클로 수행된다는 것입니다. 이 새로운 프로세서를 사용하면 단일 사이클에서 여러 명령이 수행됩니까?
nialsh

4
@nialsh CISC 컴퓨터의 경우에는 사실이 아닙니다 (실제로 CISC를 정의하는 것 중 하나는 명령어를 여러 번 사용하는 경우입니다). 교수.
Scott Chamberlain

x86 CPU는 명령 당 여러 클럭 사이클이 필요했지만 요즘에는 클럭 사이클 당 여러 명령을 실행할 수 있습니다.
Oskar Skog

13

테스트 사례 (aes-256 암호화)는 프로세서 별 최적화에 매우 민감합니다.

암호화 / 암호 해독 작업 속도를 높이기위한 특별한 지침이있는 다양한 CPU가 있습니다. 이 특별 지시 사항은 데스크탑에만있을뿐만 아니라 AMD CPU의 다른 지시 사항이있을 수 있습니다. 또한 openssl은 Intel CPU에 대해서만 이러한 특수 지침을 지원할 수 있습니다. 그런 경우인지 확인 했습니까?

어떤 시스템이 더 빠른지 알아 보려면 "적절한"벤치 마크 제품군을 사용하십시오. 또는 일반적인 작업량 만 사용하십시오.


그 특별한 지시로의 번역은 어디에서 이루어 집니까? 다른 명령어 세트에 대해 다른 컴파일러가 있는지 확실하지 않습니다.
Shubham

컴파일러에는 다른 명령어 세트 및 / 또는 CPU 관련 명령어에 밀접하게 매핑되는 특수한 "내장 함수"를 대상으로하는 옵션이 있습니다. 단일 실행 파일이 실행중인 CPU 제품군을 확인하고이를 기반으로 다른 코드 경로를 선택할 수 있습니다.
Russell Borogove

10

단순성 : AMD 칩은 16 코어 칩이므로 훨씬 빠릅니다. 115 와트에서 각 코어는 ~ 7 와트를 생산합니다. 각 코어가 3Ghz에서 실행 된 경우에는 달성 할 수 없습니다. 이 7 와트 수치를 달성하기 위해 AMD는 클럭 주파수를 낮췄습니다. 클럭 주파수를 10 % 낮추면 전력 소비가 20 % 줄어 칩에 25 %의 추가 코어를 배치 할 수 있습니다.


10

다른 사람들이 말했듯이 과거에 동일한 상대 클록 속도 증가에 필요한 전압을 푸시 해야하는 경우 더 이상 효과적으로 CPU를 냉각시킬 수 없습니다. 새 CPU를 구매할 수 있고 클럭 속도가 이전 세대에 비해 크게 증가했기 때문에 "즉시"게인이 속도 인 것을 볼 수있는 시간 (P4 및 이전)이있었습니다. 이제 우리는 열벽에 부딪 쳤습니다.

각각의 새로운 최신 세대 프로세서는 클럭 속도가 약간 증가하지만, 이는 적절하게 냉각시키는 능력과 관련이 있습니다. 인텔과 같은 칩 제조업체는 CPU의 다이 크기를 축소하여 전력 효율을 높이고 동일한 클럭에서 열을 덜 발생시키는 데 계속 주력하고 있습니다. 참고로,이 축소 된 다이 크기로 인해 최신 프로세서는 과열이 아닌 과전압으로 인해 죽기 쉽습니다. 이것은 또한 칩 메이커가 다른 최적화를하지 않고도 현재 세대 CPU의 상한 클럭 속도를 제한하고 있음을 의미합니다.

칩 제조업체가 집중하고있는 또 다른 영역은 칩의 코어 수를 늘리는 것입니다. 이것은 계산 능력의 상당한 증가를 고려하지만 다중 코어를 이용하는 소프트웨어를 사용할 때만 가능합니다. 계산 능력과 속도의 차이를 여기에서 확인하십시오. 간단히 말해서 속도는 컴퓨터가 단일 명령을 얼마나 빨리 실행할 수 있는지를 나타내는 반면, 계산 능력은 컴퓨터가 주어진 시간 동안 얼마나 많은 계산을 할 수 있는지를 나타냅니다. 최신 운영 체제 및 최신 소프트웨어는 여러 코어를 활용합니다. 문제는 동시 / 병렬 프로그래밍이 표준 선형 프로그래밍 패러다임보다 어렵다는 것입니다. 이것은 많은 개발자들이 이런 방식으로 프로그램을 작성하는 데 익숙하지 않았기 때문에 시중의 많은 프로그램이 새로운 프로세서 성능을 최대한 활용하는 데 걸리는 시간을 늘 렸습니다. 오늘날 시장에 여러 코어 나 멀티 스레딩을 활용하지 않는 일부 프로그램 (현대 또는 레거시)이 있습니다. 인용 한 암호화 프로그램이 그러한 예 중 하나입니다.

칩 제조업체의이 두 가지 초점 영역은 본질적으로 연결되어 있습니다. 칩의 다이 크기와 전력 소비를 줄임으로써 칩의 코어 수를 늘릴 수 있습니다. 그러나 결국 이것도 벽에 부딪쳐 더욱 격렬하고 패러다임의 변화를 가져올 것입니다.

이러한 패러다임 전환의 이유는 칩 생산의 기본 재료 인 실리콘의 한계에 근접했기 때문입니다. 이것은 인텔과 다른 사람들이 한동안 해결을 위해 노력해온 것입니다. 인텔은 이번 작업에서 실리콘 대신 실리콘을 사용할 수 있다고 밝혔다. 2017 년 이후 언젠가는이를 보게 될 것이다. 인텔은이 새로운 소재 외에도 "처리 능력을 효과적으로 세 배로 높일 수있는"3D 트랜지스터도 조사하고있다. 다음은 이러한 아이디어를 모두 언급하는 기사입니다. http://apcmag.com/intel-looks-beyond-silicon-for-processors-past-2017.htm


2
  • 열 손실은 H 4 차 주파수와 같습니다 f.

    H ~ f ^ 4

    따라서 주파수가 약간만 증가하면 열 손실이 높아집니다.

  • 더 먼 소형화

    주파수가 높을수록 결정 최소화가 더 커집니다. 현재로서는 나노 미터 규모의 재료를 효과적으로 사용할 수있는 기술이 없으며 나노 미터가 한계입니다.


2
-1 네 번째 전원 부분이 올바르지 않습니다. CPU에서 전력 (초당 생성 된 열)은 P ~ f CV ^ 2 + P0 ( en.wikipedia.org/wiki/CPU_power_dissipation ) 과 같은 클록 주파수에 대략 비례합니다 . 허용 전압은 클럭 속도에 따라 다릅니다 (선형적일 필요는 없음). 참고 : physics.stackexchange.com/questions/34766 결론적으로 CPU에서 생성 된 전력은 1.6GHz-5GHz 범위의 클럭 속도에서 거의 2 차에 선형입니다. (f ^ 4로 전파하지 마십시오).
jimbob 박사

2

몇 가지 다른 답변에서 언급했듯이 CPU 제조업체는 전력 소비 및 열 방출을 제어하기 위해 클럭 속도를 낮추기를 원합니다. 동일한 클럭 속도로 더 많은 작업을 수행하기 위해 몇 가지 전략이 사용됩니다.

대형 온칩 메모리 캐시는 CPU에 데이터를 전달하는 속도가 훨씬 느린 주 메모리와 달리 CPU에 더 많은 데이터를 CPU에 "가까이"유지하여 최소한의 지연으로 처리 할 수 ​​있습니다.

다른 CPU 명령어는 완료하는 데 다른 횟수의 클럭 사이클이 걸립니다. 대부분의 경우 간단한 회로를 사용하여 여러 클럭 사이클에 걸쳐 작업을 구현하거나 더 복잡한 회로를 사용하여 더 적은 수로 수행 할 수 있습니다.

Intel의 진화에서 가장 극적인 예는 Pentium 4에 있습니다. Pentium 4는 클럭 속도가 훨씬 뛰어나지 만 비례 적으로 잘 수행되지 않았습니다. 이전 칩에서 단일 사이클에서 32 비트를 시프트 할 수있는 비트 시프트 명령은 펜티엄 4에서 훨씬 간단한 회로를 사용했으며, 각 비트 시프트마다 단일 사이클이 필요했습니다. Pentium 4 아키텍처는 단순성으로 인해 훨씬 ​​더 높은 클럭 속도로 확장 가능하지만 제대로 작동하지 않았으며 코어 및 이후 아키텍처에서 빠르고 복잡한 시프트 회로가 반환되었습니다.


2

IEEE에서 :

그렇다면 왜 시계를 더 빨리 누르지 않겠습니까? 더 이상 소비 전력 및 열 소비 측면에서 비용이 들지 않기 때문입니다. 인텔은 속도 / 전력 균형을 "멀티 코어 프로세서의 기본 정리"라고 부릅니다. 이것이 단일 칩에서 둘 이상의 처리 영역 또는 코어를 사용하는 것이 합리적입니다.

http://spectrum.ieee.org/computing/hardware/why-cpu-frequency-stalled

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.