왜 메모리를 추가하면 AMD APU에서 게임 성능이 크게 향상 되었습니까?


66

처음부터 명확하게하기 위해, 이것은 문제가되지 않습니다. 이것은 내가 정말로 비밀을 알고 싶어하는 것입니다.

시스템 사양

  • CPU : AMD A10-6790K 4.0GHz
  • GPU : AMD Radeon HD 8670D 1GB (통합 GPU)
  • RAM : 2 x Team 4GB 1600 DDR3 = 8GB

물론 8GB의 메모리를 사용하기 위해 64 비트 OS를 사용하고 있지만 내 질문은 다음과 같습니다. 추가 4GB RAM을 얻기 전에 Mafia II 와 같은 게임 은 평균 22의 최고 설정에서 실행되었습니다. FPS이지만 추가 4GB RAM을 얻었을 때 게임에서 4GB 이상의 RAM을 사용하지 않는 것처럼 보이지만 프레임 속도가 40FPS로 상당히 증가한 것으로 나타났습니다.

이것의 비밀은 무엇입니까?


3
RAM은 성능이 아닌 용량을 추가합니다. 충분하지 않으면 용량이 부족한 것입니다. 업그레이드는 응용 프로그램을보다 효율적으로 실행하는 데 필요한 추가 용량을 제공했습니다. 또한 현대 시스템은 모든 램을 사용하기 전에 속도를 늦추는 많은 작업을 수행합니다 (예 : 스왑 및 캐시되지 않은 IO). 따라서 아직 모든 램을 사용하지 않는 경우에도 모든 OS는 특정 프로세스를 허용합니다.
Frank Thomas

10
이전에 메모리 모듈이 하나 뿐인 경우 이제 대역폭이 두 배입니다. 이것은 크게 증가합니다.
Daniel B

답변:


83

두 번째 메모리 모듈을 설치하면 이중 채널 모드와 두 배의 메모리 대역폭이 활성화되었습니다. GPU 성능은 메모리 대역폭에 크게 의존하며 프레임 속도는 대역폭 증가를 반영합니다.

  • AMD A10-6790K는 "가속 처리 장치"(APU) 입니다. APU는 CPU를 비교적 강력한 통합 그래픽 프로세서 (GPU)와 결합하여 별도의 그래픽 카드가 필요하지 않습니다 (적어도 더 적은 워크로드). "AMD Radeon HD 8670D"는이 APU에 내장 된 통합 GPU를 나타냅니다.

  • GPU의 성능은 메모리에서 그래픽 데이터에 빠르게 액세스 할 수있는 기능에 큰 영향을받습니다. 메모리 대역폭이 충분하지 않으면 GPU의 셰이더 코어가 종종 데이터를 기다리게되어 칩이 최대 성능으로 작동하지 못하게됩니다. 본질적으로 폰 노이만 병목 현상 의 극단적 인 경우입니다 . 오늘날의 GPU는 수천 기가 플롭의 원시 처리 능력이 아니라도 수백 개에 달하며 데이터를 너무 빨리 처리하여 메모리에서 데이터를 빠르게 읽을 수 없어서 바쁘지 않습니다.

  • 이러한 이유로 오늘날의 고성능 비디오 카드는 특수 설계된 비디오 메모리 (일반적으로 GDDR5 )를 사용하여 최대 성능을 달성합니다. 불행하게도, APU에있는 것을 포함한 대부분의 통합 GPU는 자체 전용 메모리를 얻지 못하므로 시스템 메모리를 대신 사용해야합니다.

  • AMD APU는 시스템 메모리를 그래픽 메모리로 사용하므로 통합 GPU 성능은 RAM 속도에 크게 의존합니다. DDR3 시스템 RAM은 GDDR5 비디오 메모리보다 훨씬 적은 대역폭을 제공 할뿐만 아니라 통합 GPU는 일반적인 응용 프로그램 사용을 위해이 대역폭을 CPU와 공유해야합니다. 메모리 대역폭을 늘리면이 병목 현상을 줄여 성능을 직접 향상시킵니다.

  • 시스템 메모리를 업그레이드 할 때 두 번째 메모리 모듈을 추가했습니다. 두 개의 모듈을 사용하면 메모리가 이중 채널 모드 에서 실행되므로 메모리 대역폭이 두 배가되고 결과적으로 성능이 크게 향상됩니다. 더 빠른 RAM (적어도 DDR3-1866, 바람직하게는 DDR3-2100 이상)으로 업그레이드하면 성능이 비슷하게 향상됩니다.

GPU 성능에 대한 메모리 대역폭의 영향은 잘 문서화되어 있습니다.

  • Real World Tech 는 메모리 대역폭이 GPU 성능에 어떤 영향을 미치는지 자세히 설명했습니다. GPU가 유사하거나 동일한 그래픽 카드 중에서 메모리 대역폭이 큰 그래픽 카드는 메모리 대역폭이 낮은 그래픽 카드보다 성능이 뛰어납니다.

  • Tom 's Hardware 는 A10-5800K의 통합 GPU 성능이 최대 DDR3-2100의 메모리 대역폭으로 선형으로 확장되는 것으로 나타났습니다. 최신 A10-7850K에서 PC Perspective 는 DDR3-2500 (및 그 이상)의 메모리로 빠른 선형 성능 확장을보고합니다.

Aliens vs Predator를 사용한 메모리 스케일링을 보여주는 Tom의 하드웨어 차트
출처

  • Tom 's Hardware and PC Perspective 기사에서 테스트는 이중 채널 메모리 구성으로 수행되었으므로 단일 메모리 모듈을 사용하면 업그레이드 전에 심각한 성능 병목 현상이 발생했습니다. 이 시점에서 AMD APU로 최적의 성능을 얻으려면 얻을 수있는 가장 빠른 메모리가 필요합니다.

조금 벗어난 주제를 버리십시오. +1. 2 대신 4 개의 RAM 모듈을 넣으면 더 이상 이중 채널이되지 않습니까? 4 개 모듈 또는 2 개를 갖는 것이 더 낫습니까?
OutFall

3
@ N0ir : 각 메모리 모듈 쌍이 일치하는 한 (동일한 속도 및 용량), 메모리는 이중 채널 모드에서 실행되며 완전한 성능을 얻을 수 있습니다 (그러나 안정성 또는 성능이 약간 저하 될 수 있습니다 ).
bwDraco

@ N0ir 메인 보드에 따라 다릅니다. 대부분 듀얼 채널이지만 트라이 채널 및 쿼드 채널이 가능합니다. 메인 보드가 쿼드 채널을 지원하면 4 개 모듈이 2보다 낫습니다.
Taemyr

1
여분의 RAM으로 인해 얼마나 많은 성능 향상이 있었으며 대역폭으로 인해 얼마나 많은지 알면 흥미로울 것입니다. 이를 위해 동일한 속도의 2 2GB 메모리 스틱으로 게임을 실행하고 4GB 시스템의 원래 성능과 비교할 수 있습니다.
psatek

당신의 대답을 손상하지 않기 @DragonLord 전혀 하지만, 노트 중 하나 재미있는 이야기가 있다는 것입니다 이유 APU 군단이 GDDR이없는 것은 온보드 빠른 메모리의 상당한 양이 실제로 조작하는 물리적 공간 (볼륨)이 많이 걸릴 것입니다! 인텔의 "Iris Pro"기술 은 GPU에서 사용하기 위해 CPU 다이에 128MB 의 특수 전용 RAM을 장착하지만 128MB는 가능한 한 높습니다. 요즘 많은 고급 GPU에는 1-6GB의 GDDR5가 있습니다. 대형 듀얼 슬롯 전용 GPU의 거대한 인쇄 회로 기판 (PCB)에 많은 공간이 있기 때문에 그렇게 할 수 있습니다.
allquixotic

15

개별 CPU 및 개별 GPU 대신 APU 가 있습니다 . 즉, 그래픽 카드의 전용 온보드 메모리가 아니라 텍스처 캐시 용 시스템 RAM을 공유합니다.

RAM 업그레이드가 게임의 속도를 높이는 이유는 텍스처 리소스 스와핑 때문입니다. 전반적으로 더 많은 RAM을 사용할 수 있으므로 더 많은 텍스처 데이터를 RAM에로드하고 더 오래 유지할 수 있습니다. 모든 메모리가 할당되어 있고 현재 운영 체제에서 작업을 수행하는 데 더 많은 작업이 필요하면 최근에 사용되지 않은 할당 된 메모리를 찾아 내용을 디스크에 저장 한 다음 메모리를 다시 할당하십시오. 그 작업. 해당 데이터가 다시 필요하면 디스크에서 RAM으로 다시 스왑됩니다. 이 교환은 시간이 오래 걸립니다 (상대적으로).

텍스처 데이터를 많이 바꾸었을 것입니다. RAM을 업그레이드 할 때 텍스처를 저장할 공간이 더 많았으므로 메모리 스와핑이 줄어들어 더 높은 프레임 속도로 변환됩니다.


1
이 답변에 감사드립니다. 당신은 모든 것을 상세하고 쉽게 설명했습니다;)
CyberGhostx1

-3

스타 크래프트 2 또는 적색 경보 3을 사용하는 경우, 램을 더 추가하는 것이 좋습니다.

예:

8 기가 바이트 = 100 개의 탱크 (빨간색 경고)는 점점 더 많은 탱크를 추가하여 속도를 줄임으로써 60fps가됩니다.

16gb = 250+ 탱크.

그냥 원근법에 넣습니다.

또한 오픈 월드 게임에서는 fps 하락과 딸꾹질을 줄임으로써 많은 도움이됩니다.

램은 속도를 유지하면서 FPS를 높이 지 않는 간단한 방법으로

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.