«gpu» 태그된 질문

그래픽 처리 장치-빠른 그래픽 계산과 고도의 데이터 병렬 과학 계산을 위해 제작 된 비교적 저렴한 특수 하드웨어 장치입니다.

10
GPU 컴퓨팅에는 어떤 문제가 있습니까?
그래서 나는 함께 일하는 문제가 직렬에서 가장 좋은 문제이며 병렬로 관리 할 수있는 좋은 머리를 가지고 있습니다. 그러나 지금 당장은 CPU 기반 계산으로 가장 잘 처리되는 것과 GPU로 오프로드해야 할 것에 대해 잘 모릅니다. 나는 기본적인 질문을 알고 있지만 검색의 많은 부분은 왜 또는 다소 모호한 규칙을 정당화하지 않고 서로를 …
84 gpu 

1
2013 년 말 기준 CUDA와 OpenCL
프로그래머의 관점에서 CUDA와 OpenCL은 2013 년 말 기준으로 어떻게 비교됩니까? 우리 그룹은 GPU 컴퓨팅을 활용하려고합니다. OpenCL 만 지원하고 CUDA는 지원하지 않는 하드웨어를 선택하여 우리 자신을 크게 제한하고 있습니까? 좀 더 구체적으로, 다음 가정이 맞습니까? CUDA에서 가능한 모든 것은 OpenCL에서도 가능합니다 우리가 라이브러리를 사용하지 않는 한, 주어진 작업은 그중 하나에서 수행하기가 …
34 hpc  gpu  cuda  opencl 

4
GPU가 CPU보다 빠른 통계 방법은 무엇입니까?
방금 데스크탑에 Nvidia GT660 그래픽 카드를 설치했으며, 어려움을 겪은 후 R과 인터페이스 할 수 있습니다. GPU, 특히 gputools를 사용하는 여러 R 패키지를 가지고 놀았으며 GPU와 CPU에서 몇 가지 기본 작업을 수행하는 데 걸리는 시간을 비교했습니다. 인 버팅 매트릭스 (CPU 더 빠름) qr 분해 (CPU 더 빠름) 큰 상관 행렬 (CPU …
18 r  gpu 

4
현재 사용 가능한 GPU가 배정도 부동 소수점 산술을 지원합니까?
24 개의 Intel Xeon CPU를 포함하는 노드로 구성된 Ubuntu Linux 클러스터에서 MD (Molecular Dynamics) 코드 GROMACS 를 실행했습니다 . 내 관심의 대상은 부동 소수점 산술 정밀도에 다소 민감하다는 것이 밝혀 졌으므로 배정 밀도의 높은 계산 비용에도 불구하고 단 정밀도가 아닌 배정 밀도로 GROMACS를 실행해야했습니다. 클러스터에서 GROMACS를 배정도로 컴파일했습니다. CPU에 비해 …

3

2
GPU에서 ODE 시스템을 해결하기위한 옵션?
나는 '사소한 병렬화'설정으로 ODE 시스템을 GPU에 농사 짓고 싶습니다. 예를 들어 512 개의 서로 다른 파라미터 세트로 감도 분석을 수행합니다. 이상적으로 Forward Euler와 같은 고정 된 시간 단계가 아니라 CVODE와 같은 스마트 적응 형 시간 단계 솔버를 사용하여 ODE를 해결하고 싶지만 CPU 대신 NVIDIA GPU에서 실행하고 싶습니다. 누구든지 이것을 했습니까? …
16 ode  gpu 

1
배정 밀도의 최신 GPU를 사용하여 Python을 사용한 과학적 컴퓨팅
여기 누구든지 파이썬을 통해 차세대 (예 : K20) GPU와 함께 배정도 과학 컴퓨팅을 사용 했습니까? 이 기술이 빠르게 발전하고 있음을 알고 있지만 현재이를 수행하는 가장 좋은 방법은 무엇입니까? GPU는 인기있는 과학 Python 라이브러리 numpy 및 scipy의 범위를 벗어 났으며 theano를 사용하고 싶었지만 GPU에는 float32 정밀도 만 사용하는 것 같습니다. 나는 …
14 python  gpu  precision 

4
비동기 셀룰러 오토마타를위한 병렬 (GPU) 알고리즘
비동기 셀룰러 오토마타로 설명 할 수있는 계산 모델 모음이 있습니다. 이 모델은 Ising 모델과 비슷하지만 약간 더 복잡합니다. 마치 그러한 모델이 CPU가 아닌 GPU에서 실행되는 것이 도움이 될 것 같습니다. 불행히도 그러한 모델을 병렬화하는 것은 매우 간단하지 않으며 어떻게 진행 해야하는지 명확하지 않습니다. 나는 그 주제에 관한 문헌이 있다는 것을 …

2
GPU 시스템에서 BLAS / LAPACK 또는 기타 선형 대수 루틴의 가장 빠른 구현은 무엇입니까?
예를 들어, nVidia에는 ​​CUBLAS가있어 속도가 7-14 배 향상됩니다. 기본적으로 이것은 nVidia의 GPU 카드의 이론적 인 처리량에 거의 근접하지 않습니다. GPU에서 선형 대수의 속도를 높이는 데 어떤 어려움이 있으며, 이미 사용 가능한 빠른 선형 대수 라우팅이 있습니까?

3
GPGPU 가속을위한 Nvidia K20X 및 GeForce Titan
학계 컴퓨팅, 특히 DGEMM 구성 요소에 대한 두 그래픽 카드의 차이점을 이해하려고 노력하고 있습니다. 원시 통계를 보면 둘 다 동일한 GK110 칩을 가지고 있으며 거의 ​​모든 범주에서 비슷한 통계를 가지고 있으며 동일한 코어 아키텍처를 가지고 있다고 생각합니다. 할인 전 K20X는 타이탄 비용의 약 4 배입니다. 효율성 측면에서 K20X보다 Titan을 사용하는 …

3
GPU 프로그래밍을위한 추력
난 아주 문제는 특히 적합하지 않으면 그렇게 용서해주십시오 프로그래밍 GPGPU에 새. 내가 이해 한 바에 따르면 GPU 프로그래밍은 일반적인 CPU 프로그래밍과 비교할 때 매우 복잡한 엔지니어링 작업입니다. 분기 문제, 바둑판 식 배열, 고정 된 메모리 할당 및 호스트 장치 통신 / 장치 계산 겹침에 매우주의해야합니다. 약간의 연구를 한 후에 C …

2
큰 공분산 행렬의 병렬 계산
~ 범위의 크기를 갖는 공분산 행렬을 계산해야합니다 . 우리는 GPU와 클러스터에 액세스 할 수 있으며 이러한 계산 속도를 높이는 가장 좋은 병렬 접근 방법이 무엇인지 궁금합니다.10000 × 1000010000×1000010000\times10000100000 × 100000100000×100000100000\times100000

2
공유 메모리의 GPU에서 작은 비대칭 행렬의 고유 쌍을 찾는 가장 빠른 방법
작은 (일반적으로 60x60보다 작은) 비대칭 행렬의 모든 양의 (고유 값이 양수) 양의 고유 쌍을 찾아야하는 문제가 있습니다. 고유 값이 특정 임계 값보다 작은 경우 계산을 중지 할 수 있습니다. 고유 값이 실제라는 것을 알고 있습니다. 최고의 성능을 짜기 위해 사용할 수있는 알고리즘에 대한 제안이 있으십니까? 이러한 분해를 수천 번해야하므로 속도가 …
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.