답변:
이것은 가상 프로세서 (VP)를 GPU의 물리적 프로세서 (PP)에 맞추는 문제입니다. PP의 수는 종종 2의 거듭 제곱이므로 2의 거듭 제곱과 다른 수의 VP를 사용하면 성능이 저하됩니다.
당신은 크기의 조각의 더미로 PP에 부사장의 매핑을 볼 수 있습니다 PP의 수 .
16 개의 PP가 있다고 가정하십시오.
VP를 16 개 매핑 할 수 있습니다. 1 개의 VP가 1 개의 PP에 매핑됩니다.
VP 32 개를 매핑 할 수 있습니다. VP 16 개 2 개, PP 1 개가 VP 2 개를 담당합니다.
등 실행하는 동안 각 PP는 자신이 담당하는 첫 번째 VP의 작업을 수행 한 다음 두 번째 VP
의 작업을 실행합니다. 17 VP를 사용하는 경우 각 PP는 첫 번째 PP의 작업을 실행하고 1 PP는 17의 작업을 실행 및다른 것들은 아무것도하지 않을 것입니다 (아래에서 정밀하게).
이것은 GPU에서 사용 하는 SIMD 패러다임 ( 70 년대의 벡터 라고 함 ) 때문입니다. 이것을 데이터 병렬 처리라고합니다. 모든 보호 프로파일은 동시에 동일한 데이터를 수행하지만 다른 데이터에 대해 수행합니다. https://en.wikipedia.org/wiki/SIMD를 참조 하십시오 .
더 정확하게 말하면 17 VP의 예에서, 첫 번째 조각의 작업이 완료되면 (모든 PP가 첫 번째 VP의 작업을 수행함) 모든 PP가 동일한 작업을 수행 하지만 (두 번째 VP) 작업 할 데이터 .
학습과 관련이 없습니다. 이것은 프로그래밍 일뿐입니다.