RNG, R, mclapply 및 컴퓨터 클러스터

10

R과 컴퓨터 클러스터에서 시뮬레이션을 실행 중이며 다음과 같은 문제가 있습니다. 각 X 컴퓨터에서 다음을 실행합니다.

fxT2 <- function(i) runif(10)
nessay <- 100
c(mclapply(1:nessay, fxT2), recursive=TRUE)

각각 16 개의 코어가있는 32 대의 컴퓨터가 있습니다. 그러나 난수의 약 2 %는 동일합니다. 이것을 피하기 위해 어떤 전략을 채택 하시겠습니까?

지연 시간을 설정하여 (즉, 각 작업이 각 X 컴퓨터로 전송되는 시간을 1 초 지연) fxT2에서이 문제를 피할 수있었습니다. 그러나 그것은 fxt2에 매우 임시적인 것 같습니다.

문제는 실제로 fxT2는 의사 난수와 관련된 긴 작업이라는 것입니다. 프로세스가 끝날 무렵, 나는 재생산이 아닌 동일한 통계 실험의 X * nessay 재생산을 기대합니다 . 이것이 사실인지 확인하는 방법이며 이것을 확인할 수있는 방법이 있습니까?

r random-generation parallel-computing multicore

— 사용자 603
소스

좋은 질문. 난수와 멀티 코어 패키지에 대한 이 질문 을 살펴보십시오

— csgillespie

@CSgillepsie :> 포인터에 감사드립니다.하지만 같은 문제인지 잘 모르겠습니다. 당신이 지적한 질문을 이해하는 방식은 모든 프로세스가 mclapply에 의해 생성됩니다. 여기서는 약간 다릅니다. 각 머신에서 모든 프로세스는 mclapply에 의해 생성되지만 머신 전체 에서는 그렇지 않습니다 .

— user603

6

눈이 RNG 지정된 수는 클러스터 계산에 스트림 초기화에 명시 적으로 지원한다.

두 가지 RNG 구현 중 하나를 사용할 수 있습니다.

rsprng 와
레 큐어

그렇지 않으면 손으로 조정을 수행해야합니다.

— 더크 에델 뷰텔
소스

3

병렬 컴퓨팅을 위해 특별히 설계된 RNG를 사용해야합니다. 고성능 컴퓨팅 작업보기 의 "병렬 컴퓨팅 : 난수"섹션을 참조하십시오 .

— 조슈아 울리히
소스

RNG 스트림 간에도 조정해야합니다. 스노우는 그렇게합니다.

— Dirk Eddelbuettel