«performance» 태그된 질문

알고리즘, 데이터 구조, 언어 및 라이브러리의 실행 속도 및 메모리 사용에 대한 질문

4
너무 많은 데이터를 처리하는 방법?
플라즈마 역학 시뮬레이션은 종종 너무 많은 정보를 생성합니다. 시뮬레이션 중에 최소 10 개의 속성에 대해 (8192x1024x1024x1500)의 그리드 (x, y, z, t)에 다양한 물리적 속성을 기록합니다. 이 정보는 시뮬레이션이 완료된 후에 처리됩니다. 그것으로 우리는 속성 영화를 만들고 푸리에 분석, 평균 속성을 계산합니다. 우리가 작은 시스템을 연구 할 때 가능한 한 많은 …


5
유한 요소 행렬에 대한 희소성 구조 계산
질문 : 유한 요소 행렬의 희소 구조를 정확하고 효율적으로 계산하기 위해 어떤 방법을 사용할 수 있습니까? 정보 : 저는 2 중 라그랑주 단위로 Galerkin의 방법을 사용하고 C로 작성하고 희소 행렬 저장 및 KSP 루틴에 PETSc를 사용하여 포아송 압력 방정식 솔버를 작업하고 있습니다. PETSc를 효율적으로 사용하려면 전역 강성 매트릭스를위한 메모리를 미리 …

3
포인터가있는 파생 유형의 배열을 사용할 때 포트란의 메모리 사용량
이 샘플 프로그램에서 저는 두 가지 다른 방식으로 같은 일을하고 있습니다 (적어도 그렇게 생각합니다). Linux PC에서 이것을 실행하고 top으로 메모리 사용량을 모니터링합니다. gfortran을 사용하여 첫 번째 방법 ( "1"과 "2"사이)에서 사용 된 메모리는 8.2GB이고 두 번째 방법 ( "2"와 "3"사이)에서 메모리 사용량은 3.0GB입니다. 인텔 컴파일러의 차이는 10GB와 3GB보다 훨씬 큽니다. …

4
라이브러리 함수에 대한 FLOP 카운팅
간단한 함수에서 FLOP의 수를 평가할 때 종종 기본 산술 연산자를 계산하는 식으로 내려갈 수 있습니다. 그러나 짝수 나누기가 포함 된 수학적 진술의 경우이를 수행 할 수 없으며 덧셈과 곱셈 만있는 함수의 FLOP 카운트와 비교할 수있을 것으로 기대합니다. 작업이 라이브러리에서 구현되면 상황이 더욱 악화됩니다. 따라서 특수 기능의 성능에 대한 합리적인 개념을 …

2
파이썬에서 매우 크고 희소 한 인접 행렬의 모든 고유 값을 계산하는 가장 빠른 방법은 무엇입니까?
scipy.sparse.linalg.eigsh를 사용하는 것보다 매우 크고 희소 한 인접 행렬의 모든 고유 값과 고유 벡터를 계산하는 더 빠른 방법이 있는지 알아 내려고 노력 중입니다. 행렬의 대칭 속성. 인접 행렬도 바이너리이므로 더 빠른 방법이 있다고 생각합니다. 임의의 1000x1000 희소 인접 행렬을 만들고 x230 우분투 13.04 랩톱의 여러 방법을 비교했습니다. scipy.sparse.linalg.eigs : 0.65 …

2
옥타브 : 두 벡터 행렬 사이의 거리 계산
N, M 2d 벡터를 나타내는 두 개의 행렬 Nx2, Mx2가 있다고 가정합니다. 각 벡터 쌍 (n, m) 사이의 거리를 계산하는 간단하고 좋은 방법이 있습니까? 쉽고 비효율적 인 방법은 물론입니다. d = zeros(N, M); for i = 1:N, for j = 1:M, d(i,j) = norm(n(i,:) - m(j,:)); endfor; endfor; 내가 찾은 …

3
어떤 적용 사례에서 부가적인 사전 조정 체계가 곱셈 체계보다 우수합니까?
도메인 분해 (DD) 및 멀티 그리드 (MG) 방법 모두에서, 블록 업데이트 또는 거친 보정의 적용을 가산 적 또는 곱셈으로 구성 할 수 있습니다. 포인트 솔버의 경우 이것은 Jacobi와 Gauss-Seidel 반복의 차이점입니다. S ( x o l d , b ) = x n e w 로 작용하는 대한 곱셈 스무더가 …

2
과학 코드 성능의 기본 구조는 무엇입니까?
하드웨어 및 소프트웨어 구성이 다른 두 대의 컴퓨터를 고려하십시오. 각 플랫폼에서 정확히 동일한 직렬 Navier-Stokes 코드를 실행할 때 각각 컴퓨터 1과 2에 대해 하나의 반복을 실행하는 데 x와 y 시간이 걸립니다. 이 경우 는 컴퓨터 1과 컴퓨터 2 사이의 반복 시간 차이입니다.Δ=x−yΔ=x−y\Delta = x-y 의 크기에 영향을 줄 수있는 것은 …

1
HPC의 로컬 메모리 / 계산, 네트워크 대기 시간 및 대역폭 지터에 대한 통계 모델
병렬 계산은 종종 결정 론적 로컬 계산 속도, 대기 시간 오버 헤드 및 네트워크 대역폭을 사용하여 모델링됩니다. 실제로, 이들은 공간적으로 가변적이고 비 결정적입니다. Skinner 및 Kramer (2005)와 같은 연구는 다중 모달 분포를 관찰하지만 성능 분석은 항상 결정 론적 또는 가우시안 분포를 사용하는 것으로 보입니다 (정확하지 않고 부정적 대기 시간의 긍정적 …


3
GPGPU 가속을위한 Nvidia K20X 및 GeForce Titan
학계 컴퓨팅, 특히 DGEMM 구성 요소에 대한 두 그래픽 카드의 차이점을 이해하려고 노력하고 있습니다. 원시 통계를 보면 둘 다 동일한 GK110 칩을 가지고 있으며 거의 ​​모든 범주에서 비슷한 통계를 가지고 있으며 동일한 코어 아키텍처를 가지고 있다고 생각합니다. 할인 전 K20X는 타이탄 비용의 약 4 배입니다. 효율성 측면에서 K20X보다 Titan을 사용하는 …

1
과학 컴퓨팅의 맥락에서 C ++ 11 이동 시맨틱의 영향은 무엇입니까?
C ++ 11에는 예를 들어 C ++ 03이 복사 구성 또는 복사 할당을 수행해야하는 상황에서 코드 성능을 향상시킬 수있는 이동 의미론이 도입되었습니다. 이 기사에서는 C + 11로 컴파일 할 때 다음 코드에서 5 배 속도가 향상된다고보고합니다. vector<vector<int> > V; for(int k = 0; k < 100000; ++k) { vector<int> x(1000); …

3
부동 소수점 연산 및 데이터 전송의 현재 및 미래 에너지 비용을 모델링하기위한 참고 문헌
CPU, 메모리, 네트워크 및 스토리지를 통한 부동 소수점 연산 및 데이터 전송의 현재 및 미래 에너지 비용을 모델링하기 위해 가장 중요한 문헌 및 슬라이드 참조를 찾고 있습니다. 이 질문을 커뮤니티 위키로 표시했으며 각 답변을 다음 형식으로 제한하는 것이 좋습니다. 제목, 저자, 위치 / 컨퍼런스 / 저널, 연도, DOI / URL, …

3
희소 행렬 곱셈의 오버 헤드는 무엇입니까
행렬 곱하기 (Mat * Mat 및 Mat * Vec 모두)는 0이 아닌 수 또는 행렬의 크기로 확장됩니까? 또는이 둘의 조합. 모양은 어떻습니까? 예를 들어 100 값을 가진 100 x 100 행렬 또는 100 값을 가진 1000 x 1000 행렬이 있습니다. 이 행렬을 제곱하거나 비슷한 희소성을 가진 유사한 행렬로 곱하면 첫 …

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.