나는 palaeo sciences에 사용 된 특정 유형의 모델을 맞추는 다른 방법에 대한 컴퓨터 기반 평가를 수행했습니다. 나는 큰 훈련 세트를 가지고 있었기 때문에 무작위로 (층화 된 무작위 샘플링) 테스트 세트를 따로 설정했습니다. 나는 훈련 세트 샘플에 개의 다른 방법을 적용하고 결과 모델을 사용하여 테스트 세트 샘플에 대한 응답을 예측하고 테스트 세트의 샘플에 대한 RMSEP를 계산했습니다. 이것은 단일 실행 입니다.
그런 다음 새로운 테스트 세트를 무작위로 샘플링하여 다른 훈련 세트를 선택할 때마다이 과정을 여러 번 반복했습니다.
이 작업을 수행 한 후 방법 중 하나가 RMSEP 성능이 더 나은지 또는 더 나쁜지 조사하고 싶습니다 . 또한 쌍별 방법을 여러 번 비교하고 싶습니다.
내 접근 방식은 Run에 대한 단일 임의 효과와 함께 선형 혼합 효과 (LME) 모델을 맞추는 것 입니다. 내가 사용 lmer()
으로부터 lme4의 으로부터 내 모델과 기능에 맞게 패키지 multcomp의 다중 비교를 수행하는 패키지. 내 모델은 본질적으로
lmer(RMSEP ~ method + (1 | Run), data = FOO)
어디 method
테스트 세트에 대한 모델 예측을 생성하는 데 사용 된 방법을 나타내는 요소 이며 내 "실험"의 Run
각 특정 실행 에 대한 지표입니다 .
내 질문은 LME의 잔차에 관한 것입니다. Run에 대한 단일 무작위 효과를 감안할 때 해당 실행 에 대한 RMSEP 값은 어느 정도 상관 관계가 있지만 무작위 효과가 제공하는 유도 된 상관 관계에 따라 실행간에 상관 관계가 없다고 가정합니다.
달리기 간의 독립성에 대한 가정이 유효합니까? LME 모델에서이를 설명 할 방법이 없거나 다른 유형의 정적 분석을 사용하여 내 질문에 대답해야합니까?