NVIDIA Quadro K2000 GPU를 사용하고 있습니다. 나는 달렸다. deviceQuery.exe
그 결과는 다음과 같습니다. 나는 SM 유닛이 2 개 밖에 없다고 말합니다. 나는 정말로 SM이 2 명 뿐이거나 SM의 일부가 SM에서 언급 한대로 비활성화되어 있는지 확신하지 못합니다. 이 질문에 대한 3 번째 의견 .
나는 또한 SP의 수가 SM 당 192 인 것을 보았다. 더 많은 SM을 활성화하는 방법이있을 수 있으며 SM 당 SP의 수가 줄어 듭니다.
최신 정보: 제가 요구하는 이유는 GPU 처리를 효율적으로 만들고 싶다는 것입니다. 나는 1080 x 1920의 이미지를 가지고 있는데, 나는 이것을 세 부분으로 나누었다. 나는 이러한 세그먼트 H2D를 전송하고 D2H를 비동기식으로 처리 및 전송합니다. 그러므로, 나는 블록의 크기와 블록 당 스레드 수를 선택하여 내 GPU의 하드웨어 구성을 효율적으로 활용할 수 있습니다. 게다가 2 개 이상의 SM을 가지고있는 GPU (8 개 SM이라고하자)가 SM 당 SP 수가 적다는 것은 여전히 혼란 스럽습니다. (SM 당 384/8 = 48 SP)는 2 개의 SM과 192 개의 SP를 갖는 GPU와 동일한 성능을 발휘합니다. 에스엠? 즉, 사용 가능한 SP의 총 수는 중요한 것입니까?