Keras의 LSTM (Theano 배경 사용)을 사용하여 Seq2Seq 모델 을 작업 중이며 몇 MB의 데이터조차도 훈련에 몇 시간이 필요하기 때문에 프로세스를 병렬화하고 싶습니다.
GPU가 CPU보다 병렬 처리에서 훨씬 더 낫다는 것은 분명합니다. 현재는 CPU 만 사용할 수 있습니다. 16 개의 CPU에 액세스 할 수 있습니다 (코어 당 2 개의 스레드 X 소켓 당 4 개의 코어 X 2 소켓)
Theano 의 다중 코어 지원 문서 에서 단일 소켓의 4 개 코어를 모두 사용할 수있었습니다. 따라서 기본적으로 CPU는 4 개의 CPU를 사용하고 400 개의 CPU를 사용하고 나머지 12 개의 CPU는 사용되지 않은 상태로 유지됩니다. 그것들도 어떻게 사용합니까? 작동하는 경우 Theano 배경 대신 Tensorflow를 사용할 수도 있습니다.