실험 설계 데이터 프레임에서 데 노보 데이터의 시뮬레이션.
R에 중점을 둔다면 (다른 언어 솔루션도 훌륭 할 것입니다).
실험 또는 측량을 설계 할 때 데이터를 시뮬레이션하고이 시뮬레이션 된 데이터에 대한 분석을 수행하면 설계의 장단점에 대한 훌륭한 통찰력을 얻을 수 있습니다.
이러한 접근법은 통계 테스트의 이해와 올바른 사용에 필수적 일 수 있습니다.
그러나이 과정은 다소 지루한 경향이 있으며 많은 사람들이 실험이나 조사에서이 중요한 단계를 건너 뛰게됩니다.
통계 모델 및 검정에는 데이터를 시뮬레이트하는 데 필요한 대부분의 정보 (가정 또는 명시적인 분포 진술 포함)가 포함됩니다.
분석 모델 (및 관련 가정 (예 : 정규성 및 균형), 요인 수준 및 유의성 (예 : p- 값))을 고려하여 시뮬레이션 된 데이터를 얻고 싶습니다. print (), predict (), 시뮬레이션 ()).
이러한 일반적인 시뮬레이션 프레임 워크가 가능합니까?
그렇다면 현재 그러한 프레임 워크가 있습니까?
예를 들어 다음과 같은 기능을 원합니다.
sim(aov(response~factor1+factor2*factor3),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
즉, 일반화 된 버전 :
sim.lm<-function(){
library(DoE.base)
design<-fac.design(nlevels=c(10,3,3),
factor.names=c("factor1", "factor2", "factor3"),
replications=3,
randomize=F)
response<-with(design, as.numeric(factor1)+
as.numeric(factor2)+
as.numeric(factor3)+
as.numeric(factor2)*as.numeric(factor3)+
rnorm(length(factor1)))
simulation<-data.frame(design, response)}
또는
sim(glm(response~factor1+factor2*factor3, family=poisson),
p.values=list(factor1=0.05,
factor2=0.05,
factor3=0.50,
factor2:factor3=0.05),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
또는
library(lme4)
sim(lmer(response~factor1+factor2 + (factor2|factor3)),
F_value=list(factor1=50,
factor2=50),
levels=list(factor1=1:10,
factor2=c("A", "B", "C"),
factor3=c("A", "B", "C")))
완전한 해당 data.frame을 만들 것입니다
특정 기능의 가능한 예 (
자유롭게 편집하십시오) -arima.sim
모델링 된 응답없이 요인 수준의 data.frame을 생성하는 기능이 있습니다
. conf.design
http://cran.r-project.org/web/views/ExperimentalDesign.html