단 정밀도 부동 소수점 숫자는 메모리의 절반을 차지하고 최신 기계 (GPU에서도)는 배정도에 비해 거의 두 배의 속도로 작업을 수행 할 수 있습니다. 내가 찾은 많은 FDTD 코드는 독점적으로 단 정밀도 산술 및 저장을 사용합니다. 대규모 희소 방정식 시스템을 푸는 데 단 정밀도를 사용할 수있는 경우에 대한 경험 규칙이 있습니까? 매트릭스 조건 번호에 크게 의존해야한다고 가정합니다.
또한, 필요한 경우 배정 밀도를 사용하고 배정 밀도가 필요하지 않은 단일 정밀도를 사용하는 효과적인 기술이 있습니까? 예를 들어, 행렬 벡터 곱셈 또는 벡터 내적 곱의 경우 결과를 배정 밀도 변수 (취소 오류를 피하기 위해)에 누적하는 것이 좋지만 개별 항목을 서로 곱하는 것이 좋습니다. 단 정밀도를 사용하여 곱할 수 있습니다.
현대식 FPU는 단 정밀도 (float)에서 배정 밀도 (double)로 또는 그 반대로 완벽하게 변환 할 수 있습니까? 아니면 비용이 많이 드는 작업입니까?