GPGPU 가속을위한 Nvidia K20X 및 GeForce Titan


10

학계 컴퓨팅, 특히 DGEMM 구성 요소에 대한 두 그래픽 카드의 차이점을 이해하려고 노력하고 있습니다.

원시 통계를 보면 둘 다 동일한 GK110 칩을 가지고 있으며 거의 ​​모든 범주에서 비슷한 통계를 가지고 있으며 동일한 코어 아키텍처를 가지고 있다고 생각합니다. 할인 전 K20X는 타이탄 비용의 약 4 배입니다. 효율성 측면에서 K20X보다 Titan을 사용하는 것이 훨씬 합리적입니다.

나는 여기서 차이를 이해하는 데 어려움을 겪고 있습니다. 누가 상황을 밝힐 수 있습니까?

참고로이 카드를 랙 서버용으로 구입하고 죽을 때까지 완전히 기울어 져서 실행하는 것을보고 있습니다. 그러나 단일 작업에 여러 GPU를 사용하는 것이 특히 중요하다고 생각하지 않습니다.

답변:


13

몇 가지 차이점이 있지만 반드시 하드웨어 나 사양에있는 것은 아닙니다. 이것은 포럼이나 뉴스 릴리스에서 얻은 모든 정보이므로 소금 한 덩어리로 모든 정보를 가져갑니다.

첫 번째는 "확장 성과 신뢰성"( source )입니다. K20은 클러스터 시스템에 앉아 24/7 풀 틸트 상태로 작동하도록 설계되었습니다. Titan은 게임용으로 설계되었으므로이 듀티 사이클에서 실행되지만이 방식으로 사용하면 장기적인 수명 문제가 발생할 수 있습니다.

드라이버도 다르지만 주요 차이점은 확실하지 않습니다. 카드 디자인의 초점 차이가이 전면의 Tesla 카드에 비해 성능이 약간 떨어질 수 있습니다.

"일부 테슬라 독점 기능은 다음과 같습니다.

  • InfiniBand 성능을위한 NVIDIA GPUDirect RDMA
  • MPI 용 Hyper-Q (CUDA 스트림 용 Hyper-Q는 GeForce GTX TITAN에서 지원됨)
  • 모든 내부 및 외부 레지스터 및 메모리에 대한 ECC 보호
  • Ganglia와 같은 GPU 및 클러스터 관리를 위해 지원되는 도구입니다. "( source )

이것은 주요 차이점은 확장 성이라는 사실을 나타냅니다. 사무실의 데스크톱에서 실행하려는 경우 가격 차이로 인해 K20보다 Titan에 대해 논쟁하기가 어렵습니다. 여러 K20의 추가 성능이 필요한 경우 HPC 센터를 찾아 서버와 함께 시간을 구입하십시오.

편집하다:

ECC에 대해 좀 더 자세히 살펴본 후이 답변을 업데이트하여 Titan이 아닌 K20에 미치는 영향을 지적했습니다. 다음 정보는 여기 에서 찾을 수있는 정보를 나타 냅니다.

ECC는 DRAM에서 오류를 확인하고 GPU를 등록합니다. 소프트 오류는 비트가 잘못 전송 / 저장 될 때 발생합니다. 회로가 더 빠르고 서로 가깝을수록 소프트 에러의 가능성이 높아집니다. 결합 된 ODE 세트를 해결하거나 선형 시스템을 해결하는 경우 단일 숫자가 1 비트 씩 떨어지면 결과를 재현 할 수없는 방식으로 크게 변경할 수 있습니다. CPU의 대부분의 표준 RAM 및 캐시는 ECC를 사용하여 이러한 오류에 대해 오류를 검사합니다.

반면 GPU는 일반적으로 메모리 버스가 CPU의 메모리 버스보다 훨씬 빠르더라도 ECC를 갖지 않습니다. 화면의 픽셀이 한 프레임에 대해 조금씩 꺼져 있으면 프로그램의 품질이 떨어지지 않기 때문입니다. 이러한 오류는 전파되지 않습니다. 따라서이 기능을 건너 뛰면 많은 칩 면적 (및 비용)을 절약 할 수 있습니다. 이러한 추가 복잡성으로 인해 Tesla 라인의 추가 비용이 상당 부분 발생할 수 있습니다.


3
좋은 답변 +1! 이러한 기능이 비용이 많이 든다고 믿기가 어렵습니다. 링크 된 Nvidia 사이트의 "GeForce로 개발, Tesla로 배포"라인이 중요한 문제를 요약한다고 생각합니다. 지금까지 가장 좋은 해결책은 여러 개의 GeForces를 구입하여 파란 연기를 포기할 때까지 열심히 실행하는 것입니다.
Ophion

3
"그러나 이것이 오크 리지에서 사용되는 것을 막지는 못했습니다." "Titan"이라는 OLCF의 Cray XK7 은 GTX Titan이 아닌 Tesla K20 GPU를 사용합니다. NVidia에 따르면 GTX 타이탄에는 OLCF 타이탄의 "기술"이 있으며, 이는 경제 자동차에 포뮬러 -1 자동차의 "기술"이 있다고 말할 때 사용하는 것과 같은 어휘입니다. (GTX 타이탄의 성능은 꽤 좋지만 ECC가 없으며 내가 알고있는 주요 설치에는 사용되지 않습니다.)
Jed Brown

1
내 실수로 기사를 잘못 해석했습니다. 오해의 소지가 없도록 답변을 업데이트하겠습니다.
Godric Seer

2

제 생각에는 차이는 대부분 시장 세분화 인 것 같습니다. 과학자라면 NVidia는 K20X에서 사용할 수있는만큼 많은 RAM 오류 수정없이 GPGPU를 사용하기 때문에 논문이 거부 될 것을 두려워합니다. 마찬가지로 회사 인 경우 계산이 가능한 한 잘못 수정되지 않았다는 의심에 대해 고소 당할 가능성이 적다는 것을 의미하는 경우 4 배를 지불 할 수 있습니다. 개인 게이머 또는 취미 GPGPU는 돈이 적고 이러한 방식으로 설득하기가 어렵 기 때문에 Titan으로 판매됩니다.


2
ECC로만 계산을 수행했습니다. 비 ECC 시스템 및 논리적 중단 점의 이점을 보여주는 유용한 기사가 있습니까?
Ophion


BenC의 매우 우수한 링크에 대한 요약을 원하는 사람들에게는 ECC가 고칠 수있는 소프트 오류가 매우 드물며, 논문은 속도를 높이기 위해 Tesla에서 ECC를 끄는 것을 권장합니다. 주의 사항 : 이것은 실제로 소비자 GPU로 테스트되지 않았습니다.
semi-exrinsic

0

실제로 실행하는 응용 프로그램에 따라 다릅니다. GPUGRID.net은 ECC가 설치되지 않은 시스템에서 실행되며 모든 것이 정상입니다. 결과는 다른 플랫폼에서와 마찬가지로 우수합니다. Acellera는 또한 GeForce 카드가 장착 된 하드웨어를 판매하며 GPU 고장이 거의 발생하지 않습니다. GeForce 만 있으면됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.