정확히 똑같은 두 개의 스크립트가 있습니다.
그러나 한 스크립트는 82.7KB의 3 개의 RData 파일을 생성하고 다른 스크립트는 120KB의 3 개의 RData 파일을 생성합니다.
첫 번째는 병렬이 아닙니다.
library("plyr")
ddply(.data = iris,
.variables = "Species",
##.parallel=TRUE,##Without parallel
.fun = function(SpeciesData){
#Create Simple Model -------------------------------------------------------------
Model <- lm(formula = "Sepal.Length~Sepal.Width+Petal.Length+Petal.Width",data = SpeciesData)
#Save The Model -------------------------------------------------------------
save(Model,
compress = FALSE,
file = gsub(x = "Species.RData",
pattern = "Species",
replacement = unique(SpeciesData$Species)))
})
두 번째는 병렬입니다.
library("plyr")
doSNOW::registerDoSNOW(cl<-snow::makeCluster(3))
ddply(.data = iris,
.variables = "Species",
.parallel=TRUE,##With parallel
.fun = function(SpeciesData){
#Create Simple Model -------------------------------------------------------------
Model <- lm(formula = "Sepal.Length~Sepal.Width+Petal.Length+Petal.Width",data = SpeciesData)
#Save The Model -------------------------------------------------------------
save(Model,
compress = FALSE,
file = gsub(x = "Species.RData",
pattern = "Species",
replacement = unique(SpeciesData$Species)))
})
snow::stopCluster(cl)
두 번째 스크립트는 무게가 42 % 더 많은 파일을 만듭니다.
파일 크기를 자동으로 늘리지 않고 파일을 병렬로 저장하려면 어떻게해야합니까?
r lang lock file
5 초 후 원하는 패키지 찾을 수 cran.r-project.org/web/packages/filelock/filelock.pdf