비활성화 된 스트리밍 프로세서 (SM)를 활성화하는 방법은 무엇입니까?


-1

NVIDIA Quadro K2000 GPU를 사용하고 있습니다. 나는 달렸다. deviceQuery.exe그 결과는 다음과 같습니다. 나는 SM 유닛이 2 개 밖에 없다고 말합니다. 나는 정말로 SM이 2 명 뿐이거나 SM의 일부가 SM에서 언급 한대로 비활성화되어 있는지 확신하지 못합니다. 이 질문에 대한 3 번째 의견 .

나는 또한 SP의 수가 SM 당 192 인 것을 보았다. 더 많은 SM을 활성화하는 방법이있을 수 있으며 SM 당 SP의 수가 줄어 듭니다.

image

최신 정보: 제가 요구하는 이유는 GPU 처리를 효율적으로 만들고 싶다는 것입니다. 나는 1080 x 1920의 이미지를 가지고 있는데, 나는 이것을 세 부분으로 나누었다. 나는 이러한 세그먼트 H2D를 전송하고 D2H를 비동기식으로 처리 및 전송합니다. 그러므로, 나는 블록의 크기와 블록 당 스레드 수를 선택하여 내 GPU의 하드웨어 구성을 효율적으로 활용할 수 있습니다. 게다가 2 개 이상의 SM을 가지고있는 GPU (8 개 SM이라고하자)가 SM 당 SP 수가 적다는 것은 여전히 ​​혼란 스럽습니다. (SM 당 384/8 = 48 SP)는 2 개의 SM과 192 개의 SP를 갖는 GPU와 동일한 성능을 발휘합니다. 에스엠? 즉, 사용 가능한 SP의 총 수는 중요한 것입니까?


여분의 장치는 물리적 칩 다이의 특정 중요한 링크를 레이저로 조사하여 사용할 수 없으며, ~ 할 수 없다. 어떤 방식 으로든 소프트웨어 또는 하드웨어를 통해 다시 활성화 할 수 있습니다. 이것은 당신이 원하는 종류의 것을 막을 가능성이 큽니다. 그 중 일부 SM들 실제로 장애인 이외의 기능을 수행하는 것은 테스트 중에 오작동을 일으켰 기 때문에 장애인이 될 수도 있습니다. 가장 저렴하고 장애가 발생한 부분을 다시 활성화 할 수 있기를 바라면서 실제로 필요한 것을 구입하는 것이 훨씬 쉽고 쉽습니다.
Mokubai

@Mokubai : NVIDIA Quadro K2000에는 기능 3.0이 있습니다. 거의 새로운 세대의 GPU입니다. 정말로 SM이 2 명 밖에 없어야한다고 생각하십니까? 내가 GPU에 대해 읽었을 때 GPU는 일반적으로 2 ~ 30 개의 SM을 가지고 있다고합니다. 그리고이 최신 GPU에는 SM가 2 개 밖에 없다는 것을 믿을 수 없습니다.
skm

1
K2000이 쿼드로 라인의 "저렴한 물통"쪽에 있다는 것을 감안하면 놀랄 일은 없을 것입니다. 만나다 en.wikipedia.org/wiki/... 당신이 2를 가지고 있다는 것을 확인하기 위해 기능의 SMX 장치. 모든 SMX 장치가 더 많은 칩을 가지고 있지만 가능성이 있습니다. 신체적으로 장애가 발생했거나 결함이 있거나 트랙을 레이저로 잘라서 장애가 발생했습니다.
Mokubai

귀하의 "최신"GK107은 사실 3 년이 넘었으며 최종선 부분이며 정확히 192 개의 코어가있는 2 개의 SMX가 있습니다. tomshardware.com/reviews/geforce-gt-640-review,3214.html (귀하의 K2000은이 카드의 Quadro 버전입니다). 또한 실리콘 위의 트랜지스터가 스스로를 재구성하도록하는 마법 소프트웨어 명령은 없습니다. 이 질문들 모두가 단지 구매자들에게 유감 스럽습니까? 아니면 당신이 이것을 묻는 근본적인 이유가 있습니까?
talonmies

@ 탈론미스 (Thalonmies) : 나는이 질문을 한 이유를 말하지 않았다. 그래서 누군가가 하드웨어 질문을하지 말라고했기 때문이다. 그래서 여기에서 하드웨어 문제에 대해 물어 보았습니다. 어쨌든, 나는이 질문을하는 이유를 명확히하기 위해 나의 질문을 업데이트했다.
skm

답변:


1

순서대로 :

  1. 나는 정말로 SM이 2 명 밖에 없거나 SM의 일부가 비활성화되어 있는지 잘 모르겠습니다.

    귀하의 GPU는 GK107입니다. 그것에는 2 개의 SMX가 있고 각각 192 SP가 있습니다. 사용할 수없는 프로세서는 없습니다.

  2. [SM] 거기에 더 많은 SM을 활성화하는 몇 가지 방법이있을 수 있습니다 다음 SM 당 SP의 수가 줄어 듭니다.

    소프트웨어에서 실리콘을 변경하는 마법 같은 방법은 없습니다.

  3. 나는 여전히 SM 당 2 개 이상의 SM을 가진 GPU (SM은 8 개라고하자)가 SM 당 2 개 SM 및 192 개 SP를 갖는 GPU와 동일한 성능을 발휘한다는 것을 혼란 스럽습니다.

    그것은 거대한 질문이며 여기서 대답하려고하지는 않을 것입니다. NVIDIA는 각 세대가 출시 될 때 주력 컴퓨팅 카드의 다양한 세대의 아키텍처와 성능에 대한 매우 상세한 백서를 발표했습니다. 당신이 그렇게 생각한다면, 나는 너 자신을 위해 그것을 읽는 것이 좋습니다. 말하자면, 엄지 손가락의 규칙은 동일한 건축 세대 내에서 장치가 SM 또는 SMX가 많을수록 산술 바운드 작업에서 더 잘 수행됩니다. 다른 세대의 GPU를 비교하는 것은 효과가 없습니다. 예를 들어, 최초의 Telsa 컴퓨팅 카드 NVIDIA는 16 개의 SM (C860)을 출시했습니다. 가장 최근에는 15 개의 SMX (K40)가 있습니다. 최고 단 정밀도 성능에는 약 10 배의 차이가 있습니다. 또한 많은 실제 응용 프로그램이 메모리 대역폭에 묶여 있으며 이는 다른 카드 간의 성능 차이를 근본적으로 바꿀 수 있습니다. 코어 카운트와 피크 FLOP에는 무어의 법칙이 어느 정도 일치하지만 메모리 밴드 위디는 그렇지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.