GPU로 훈련받은 딥 러닝 신경망을 실행하고 있습니다. 이제 추론을 위해 이것을 여러 호스트에 배포하고 싶습니다. 문제는 추론을 위해 GPU 또는 CPU를 사용해야하는지 여부를 결정하는 조건은 무엇입니까?
아래 주석에서 더 자세한 내용을 추가하십시오.
나는 이것에 익숙하지 않으므로 지침에 감사드립니다.
메모리 : GPU는 K80
프레임 워크 : Cuda와 cuDNN
워크로드 당 데이터 크기 : 20G
컴퓨팅 노드 사용 : 스케일 옵션을 고려하고 싶지만 작업 당 하나씩
비용 : 이유가 맞다면 GPU 옵션을 사용할 수 있습니다
배포 : 클라우드가 아닌 자체 호스팅 베어 메탈 서버에서 실행
지금은 응용 프로그램이 정상적으로 실행되기 때문에 CPU에서 실행 중입니다. 그러나 그 이유 외에는 왜 GPU를 고려할 지 확신 할 수 없습니다.