«blas» 태그된 질문

기본 선형 대수 하위 프로그램-벡터-벡터, 행렬-벡터 및 행렬-행렬 연산이 포함 된 표준 API 라이브러리입니다.

6
포트란 컴파일러는 실제로 얼마나 나을까?
이 질문은 최근 " C ++ vs Fortran for HPC " 에 대한 답변에서 최근에 제기 된 두 가지 토론의 확장입니다 . 그리고 그것은 질문보다 조금 더 도전입니다 ... Fortran에 유리한 주장 중 하나는 컴파일러가 더 좋다는 것입니다. 대부분의 C / Fortran 컴파일러는 동일한 백엔드를 공유하므로 두 언어에서 의미 적으로 …
74 fortran  c  blas  benchmarking 

3
BLAS, LAPACK 및 기타 선형 대수 라이브러리의 관계는 무엇입니까?
내가 작업 한 프로젝트의 C ++ 선형 대수 라이브러리를 살펴 보았습니다. 여전히 이해하지 못하는 것은 BLAS와 LAPACK을 다른 선형 대수 라이브러리에 연결하는 것입니다. 선형 대수 라이브러리에 대한이 기사를 살펴보면 흥미로운 점을 발견했습니다. 일부 라이브러리는 BLAS 및 LAPACK과 독립적입니다. 일부는 BLAS 및 LAPACK이 필요합니다 일부는 BLAS 및 LAPACK에 대한 선택적 인터페이스가 …

3
BLAS 구현은 동일한 결과를 보장합니까?
두 가지 다른 BLAS 구현이 주어지면 정확히 동일한 부동 소수점 계산을 수행하고 동일한 결과를 반환 할 것으로 기대할 수 있습니까? 또는 예를 들어 스칼라 곱을 하고 다른 하나는 계산하여 IEEE 부동 소수점에서 다른 결과를 얻을 수 산수?( ( x1와이1+x2와이2) + x삼와이삼)+ x4와이4((엑스1와이1+엑스2와이2)+엑스삼와이삼)+엑스4와이4 ((x_1y_1 + x_2y_2) + x_3y_3) + x_4y_4 ( …

3

3
매트릭스-벡터 곱셈 스케일링이 아닌 이유는 무엇입니까?
긴 게시물에 대해 죄송하지만 첫 번째 이동과 관련이 있다고 생각되는 모든 것을 포함하고 싶었습니다. 내가 원하는 것 고밀도 행렬에 대한 병렬 버전의 Krylov Subspace Methods를 구현하고 있습니다. 주로 GMRES, QMR 및 CG. 나는 (프로파일 링 후) 내 DGEMV 루틴이 한심하다는 것을 깨달았다. 그래서 나는 그것을 격리함으로써 그것에 집중하기로 결정했습니다. 12 …

2
고밀도 매트릭스에 PETSc가 얼마나 유용합니까?
내가 본 곳마다 PETSc 튜토리얼 / 문서 등은 선형 대수학에 유용하며 일반적으로 스파 스 시스템이 도움이 될 것이라고 지정합니다. 고밀도 매트릭스는 어떻습니까? 조밀 한 대한 해결에 대해 걱정하고 있습니다.Ax=bAx=bAx=bㅏAA Fortran에서 CG 및 QMR에 대한 자체 코드를 작성했습니다. 기본적인 구성은 의사 코드를 분리하고 가능한 한 약간의 자체 조정으로 BLAS 루틴을 추가하는 …

2
과학 컴퓨팅에서 복잡한 산술의 위험
복소 내적 : 규칙에 의해 결정된 두 가지 정의 보유 ˉ U T V 또는 U T ˉ 브이 . BLAS에서 cdotu, zdotu 및 cdotc, zdotc 루틴을 찾았습니다. 전자의 두 루틴은 실제로 u T v (가짜 내부 제품!)를 계산하고 마지막 두 루틴은 내부 제품의 첫 번째 벡터를 결합합니다. 또한, 어느 …

6
C / C ++에 BLAS의 참조 수준 구현이 있습니까?
netlib BLAS 구현은 훌륭한 참조이며, 대부분 최적화되지 않고 잘 문서화되어 있습니다 (예 : zgemm ). 그러나 그것은 Fortran 77에 있으며, 더 현대적인 프로그래밍 교육을받은 사람들에게는 다소 접근 할 수 없습니다. C / C ++에 netlib와 같은 BLAS의 참조 레벨 구현이 있습니까?
11 blas  education 

2
GPU 시스템에서 BLAS / LAPACK 또는 기타 선형 대수 루틴의 가장 빠른 구현은 무엇입니까?
예를 들어, nVidia에는 ​​CUBLAS가있어 속도가 7-14 배 향상됩니다. 기본적으로 이것은 nVidia의 GPU 카드의 이론적 인 처리량에 거의 근접하지 않습니다. GPU에서 선형 대수의 속도를 높이는 데 어떤 어려움이 있으며, 이미 사용 가능한 빠른 선형 대수 라우팅이 있습니까?

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.