제한된 최대 우도가 왜 분산의 더 나은 (편견없는) 추정치를 산출합니까?


11

나는 R의 lme4 패키지에 대한 Doug Bates의 이론 논문 을 읽고 혼합 모델의 핵심을 더 잘 이해하고 있으며 제한된 최대 우도 (REML)를 사용하여 분산을 추정하는 것에 대해 더 잘 이해하고 싶은 흥미로운 결과를 발견했습니다. .

REML 기준의 3.3 절에서 분산 추정에 REML을 사용하는 것은 적합 선형 모형의 잔차 편차로부터 분산을 추정 할 때 자유도 보정의 사용과 밀접한 관련이 있다고 언급합니다. 특히, "일반적으로 이러한 방식으로 도출되지는 않지만"자유도 보정은 "REML 기준"(식 (28))의 최적화를 통해 분산을 추정하여 도출 할 수 있습니다. REML 기준은 본질적으로 가능성 일 뿐이지 만 선형 적합 모수는 적합 추정치와 동일하게 설정하는 대신 편향된 표본 분산을 제공하는 대신 주 변화를 통해 제거되었습니다.

나는 수학을하고 고정 효과 만있는 간단한 선형 모델에 대해 주장 된 결과확인했습니다 . 내가 어려움을 겪고있는 것은 해석입니다. 적합 모수가 소외 될 가능성을 최적화하여 분산 추정치를 도출하는 것이 자연스러운 관점이 있습니까? 마치 후자의 가능성을 생각하고 마치 임의의 변수 인 것처럼 적합 매개 변수를 소거하는 것처럼 일종의 베이지안을 느낍니다.

아니면 정당화는 주로 수학적인가? 선형적인 경우에는 작동하지만 일반화 할 수 있습니까?

답변:


4

1

고정 이펙트는 '평균에 대한 모형'을 결정하므로 데이터에서 평균을 추정하지 않고 도출 된 분산 추정치를 찾을 수있는 경우 ( '고정 효과를 평균화하여 (즉, 평균)')이 과소 평가 스프레드 (즉, 분산)가 완화됩니다.

이것이 왜 REML 추정이 편견을 제거하는지 이해하는 '직관적 인'이해입니다. '추정 평균'을 사용하지 않고 분산 추정값을 찾습니다.


1

저자 : David Dickey 의이 SAS 관련 리소스 내에서 부록 : REML 추정 방법을 확인하십시오 .

" 우리는 항상 알려진 평균이 0이고 n 제곱 값과 동일한 제곱합과 이론적 분산을 갖는 (n-1) 개의 숫자 Z를 찾을 수 있습니다. 이것은 Z 제곱합을 Z의 수로 나눈 것입니다. -1. "

내가 대학원에있을 때, REML은 얇게 썬 빵 이후 가장 좋은 것으로 만들어졌습니다. lme4 패키지를 연구 한 결과 , 나는 그것이 그것을 잘 일반화하지 못한다는 것을 배웠고 아마도 위대한 사물 체계에서 그렇게 중요하지 않을 수도 있습니다.


어쩌면 ... 흥미로운 수학과 통계는 아닙니다.
Paul

폴에 동의합니다. REML은 통계에서 우아하고 창의적인 문제 해결의 훌륭한 예라고 생각합니다. 실제로 실제로 사용되고 있으며 통계 연구에서 기대할 수있는 전부일 것입니다.
Ben Ogorek는
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.