혼합 모형에서 예측할 때 랜덤 효과에 불확실성을 통합하는 것이 어려운 이유는 무엇입니까?


10

여러 스레드가 R-SIG는-ME 사용하여 예측에 대한 신뢰 구간을 구하는 방법에 대한 lme4nlme예를 들어 R.에서 여기여기 Dougals 베이츠, 두 패키지의 저자 중 하나에 의해 약간의 해설을 포함하여, 2010 년. 나는 그들이 문맥에서 벗어나는 것에 대한 두려움 때문에 그에게 구두로 인용하는 것을 주저하지만 어쨌든 그가 한 의견은

"예측에서 매개 변수와 랜덤 변수를 결합하고 있으며 이러한 예측의 변동성을 평가하는 것이 무엇을 의미하는지 잘 모르겠습니다. 베이지안은 이해할 수는 있지만 머리를 숙일 수는 없습니다. " https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html

베이지안 glmm 패키지 MCMCglmm가 예측을위한 신뢰할 수있는 간격을 생성 할 수 있다는 것을 알고 있습니다.

최근 lme4에 github 의 개발 버전에 predict방법이 제공되었지만 다음과 같은 의견이 수반됩니다.

"@note 분산 매개 변수에 불확실성을 통합하는 효율적인 방법을 정의하기 어렵 기 때문에 예측의 표준 오류를 계산할 수있는 옵션이 없습니다.이 작업에는 \ code {\ link {bootMer}}을 권장합니다." https://github.com/lme4/lme4/blob/master/R/predict.R

잦은 설정에서 혼합 모형으로부터 예측을 할 때 랜덤 효과에 불확실성을 포함시키는 것이 왜 어려운가?

답변:


4

예측 방법 주석에 대해서는 잘 모르겠지만 주요 문제는 분산 측정 자체가 아니라 쉽게 해석 할 수있는 분산 측정을 생성하는 것과 관련이 있습니다. 베이츠는 당신이 그것을 할 수 있는지, 그것이 의미하는 바에 대해 첫 번째 인용에서 언급하지 않습니다.

2 단계 반복 측정 설계의 간단한 다중 레벨 모델을 가져옵니다. 각 줄이 주제 인 다음 데이터가 있다고 가정 해 봅시다.

여기에 이미지 설명을 입력하십시오

에서 lmer모델로 표현 될 수있다 :

y ~ x + (1|subject)

고정 된 효과 (A와 B의 차이)로 x의 y 값을 예측하고 있습니다. 그리고 임의의 효과를 가로 챌 수 있습니다 **. 그래프를주의 깊게 살펴보고 각 대상 (x 선의 기울기)에 대한 x 효과에 변동성이있는 반면, 대상 간 변동 (각 선의 높이)에 비해 상대적으로 작습니다.

모형은이 두 가지 변동성 집합을 구문 분석하며 각각은 의미가 있습니다. 임의 효과를 사용하여 선의 높이를 예측하고 고정 효과 x를 사용하여 경사를 예측할 수 있습니다. 두 값을 결합하여 개별 y- 값을 사용할 수도 있습니다. 그러나 당신이 할 수없는 것은 기울기의 변동성과 선의 높이를 함께 결합 할 때 실제로 모델과 관련하여 의미있는 말을하는 것 입니다. 기울기의 변동성과 선의 높이에 대해 별도로 이야기해야합니다. 그것은 책임이 아니라 모델 의 특징 입니다.

비교적 쉽게 추정 할 수있는 x의 효과에 대한 변동성이 있습니다. 그 주위에 신뢰 구간에 대해 말할 수 있습니다. 그러나이 신뢰 구간은 특정 y 값의 예측과 관련이 거의 없습니다. y 값은 효과의 변동성과는 다른 효과와 주제 분산의 조합에 의해 영향을 받기 때문입니다.

베이츠가 당신이 인용 한 것과 같은 것을 쓸 때, 나는 그가 접근하지 않는 훨씬 더 복잡한 다단계 디자인을 종종 생각한다고 상상합니다. 그러나이 간단한 예제를 고려하더라도 모든 분산 측정 값을 결합하여 어떤 종류의 실제 의미를 추출 할 수 있는지 궁금해합니다.

** 간결함을 위해 차단의 고정 효과를 무시하고 임의 효과로 취급했습니다. 임의의 고정 된 절편 만있는 더 단순한 모델에서 유사한 결론을 추출 할 수 있지만 전달하기가 더 어렵다고 생각합니다. 이 경우에도 고정 효과와 임의 효과는 이유에 따라 구문 분석되어 다른 것을 의미하며 예측 값에 대해 변동성을 다시 조합하면 변동성이 모델과 관련하여 거의 의미가 없습니다.


그래서, 당신이 말하는 것은 이것이 주제 편차를 오류로 취급할지 또는 별도로 분할하고 존재하지 않는 척하는지 여부에 대해 확신하지 못하는 것과 같은 오래된 톱으로 귀결된다는 것입니다. 맞습니까?
russellpierce

나는 그 오래된 톱을 들어 본 적이 없다. 나는 당신이 주제 차이가 존재하지 않는 척해야한다고 들었습니다. 그러나이 특정 예와 관련이 있다고 가정합니다. 모델은 분산을 구문 분석합니다. 모델링 프로세스의이 기능은 모델을 이해하는 방법입니다. 분산을 다시 결합하면 처음부터 모델의 목적을 무효화하게됩니다. 나는 주제 차이를 무시하지 말고 주제의 무작위 효과가 분리된다는 것입니다. Blouin & Riopelle (2005)를 읽고 분산을 결합 할 때 SE의 의미가 어떻게 변하는 지 확인할 수 있습니다.
John

어쩌면 나는 뭔가를 놓치고 있지만 이것은 피험자 / 반복 척도 분산 분석에 가장 효과적인 효과 크기와 그 신뢰 구간이 가장 잘 그려지는 방법에 대해 앞뒤로 사람들이 갖는 것처럼 보입니다. 내가 더 이상 잃어버린 것이 무엇이든 놓치지 않을 것이라고 지적했습니다. :) 감사.
russellpierce

내가 말했듯이, 그들은 관련이 있습니다. 나는 앞뒤가 있다는 것을 몰랐고 참조를보고 싶습니다. 사실, 두 CI와 효과는 서로 다른 의미를 갖습니다. 그래서 당신은 당신이 원하는 것을 전달하는 것을 사용합니다. 그리고 당신은 그것들을 합리적으로 보이게 만들어야합니다. [반복 된 측정 설계에서 평균에 주제 차이를 포함하는 CI를 배치하고이를 사용하여 반복 된 측정 효과에 대해 무언가를 말하는 것이 합리적이라고 주장하기는 어렵습니다.]
John

나는 문학에서 아무것도 보지 못했고, 많은 비공식적 인 손 짜기 및 리뷰어 리뷰가 어떻게 생각할지 추측하려고합니다.
russellpierce

1

오랫동안 나는 (일반적으로 비선형) 혼합 효과 모델에 대한 고정 효과와 무작위 효과에 근본적인 차이가 있다는 일반적인 상식에 대해 궁금해했다. 이 믿음은 예를 들어 Bates가 다음과 같은 응답으로 언급했습니다.

https://stat.ethz.ch/pipermail/r-sig-mixed-models/2010q1/003447.html

베이츠는 고정 효과와 무작위 효과 사이에 근본적인 차이가있어 효과를 발휘할 수 없다고 주장했다. 나는 그가 틀렸다고 생각하고 몇몇 독자들에게 다른 관점을 설득하기를 희망한다. 나는 자주 사용하는 접근 방식을 취하기 때문에 고정 효과와 임의 효과의 함수에 대한 프로파일 가능성의 개념을 정의하는 것입니다. 토론에 동기를 부여하기 위해 매개 변수 x와 u를 가진 두 개의 매개 변수 모델이 있다고 가정합니다 (지금까지 임의의 효과에 대해서는 없음). 를 데이터에 대한 참조를 억제하는 우도 함수라고 합시다 . 하자 X 및 U 중 (좋은) 함수이다. 함수 대한 프로파일 우도 는g ( X , U ) P g ( t ) gL(x,u)g(x,u)Pg(t)g

Pg(t)=maxx,u{L(x,u) | g(x,u)=t}\eqno(1)

나는 아무도 이것에 대해 논쟁하지 않을 것이라고 믿는다. 이제 대한 사전 확률 분포 가 있다고 가정 합니다. 그런 다음 대한 프로파일 가능성은 여전히 합리적 이라고 주장 하지만 이전을 포함하여 (1)을 수정해야합니다.p(u)g

Pg(t)=maxx,u{L(x,u)p(u) | g(x,u)=t}\eqno(2)
참고 때문에 와 파라미터 이전에는 임의 효과라고하는 것과 정확히 동일합니다. 왜 많은 사람들이 랜덤 효과 매개 변수가 어떻게 다른지 생각합니다. 내가 생각하는 차이점은 일반적인 매개 변수 추정 관행에서 비롯됩니다. 랜덤 효과를``다른 ''만드는 것은 많은 모델에 많은 효과가 있다는 것입니다. 결과적으로 고정 효과 (또는 다른 매개 변수)에 대한 유용한 추정치를 얻으려면 랜덤 효과를 다른 방식으로 처리해야합니다. 우리가하는 일은 그것들을 모델에서 통합하는 것입니다. 위의 모델에서 우리는 우도 형성 할 것입니다. 여기서 이제uF(x)
F(x)=L(x,u)p(u)du
u죽었다. 따라서 우리가 가진 모든 것이 라면 어떤 함수 에 대한 프로파일 가능성에 대해 이야기하는 것은 의미가없는 것 같습니다 .F(x)g(x,u)

따라서 함수 에 대한 정보를 얻으려면 매개 변수 통합해서는 안됩니다 . 그러나 임의의 효과 매개 변수가 많은 경우에 발생합니다. 그런 다음 우리가``가장 많이 ''통합해야한다고 주장하지만 모든 것이 정확하지는 않습니다. 구성에 동기를 부여하려면 임의 효과 . 함수 가 에만 의존 하고 실제로는 가장 간단한 함수 . 랜덤 효과 에 통합하여 g(x,u)unu=(u1,u2,...,un1,un)g(x,u)ung(x,u)=unu1,u2,...,un1

F(x,un)=L(x,u1,...,un)p(u1,...,un))du1du2...dun1\eqno(4)
이전과 같이 우리는 프로파일 우도를 형성 할 수있다 임의 함수 적합하도록 일반화하는 방법 . 정의 것을 잘 공지 에서 와 동일 이 참고를보기 위해 간단한 경우 에서 는 다음과 같습니다.
Pg(t)=maxx,un{F(x,un)|un=t}\eqno(3)
(3)g(x,u)F(x,un)(4)
F(x,s)=limϵ01ϵ{(x,un)|sϵ/2<g(x,un)<s+ϵ/2}L(x,u1,...,un)p(u1,...,un))du1du2...dun\eqno(5)
g(x,u)=un(5)
F(x,s)=limϵ01ϵ{(x,un)|sϵ/2<un<s+ϵ/2}F(x,un)dun\eqno(6)

일반 함수 의해 정의 된 함수 형성하고 프로파일 우도 g(x,u)F(x,s)(5)

Pg(s)=maxx,u{F(x,s)|g(x,u)=s}\eqno(3)

이 프로파일 가능성은 잘 정의 된 개념이며 그 자체입니다. 그러나 실제로 유용하기 위해서는 적어도 대략 그 값을 계산할 수 있어야합니다. 많은 모델 에서 Laplace 근사 변형을 사용하여 함수 를 충분히 근사 할 수 있다고 생각합니다 . 정의 에 의해 H 는 매개 변수 및 대해 함수 의 로그에 대한 헤 시안이라고하자 .F(x,s)x^(s),u^(s)

x^(s),u^(s)=maxx,u{L(x,u)p(u) | g(x,u)=s}
L(x,u)p(u)xu

레벨 세트 있는 의 AN submanifolds 차원 있다 차원 공간 고정 효과와 랜덤 효과. 우리는 통합해야 형태 모두에서 선형화이 매니 폴드를 통해 이 초등학교 미분 기하학의 비트를 포함합니다. 한다고 가정 우리를 reparameterizing 저자는 assum 수 및 . 그런 다음지도를 고려하십시오 gm+n1n+mmnndu1du2dunx^(s),u^(s)gxn(x^(s),u^(s))0x^(s)=0u^(s)=0

(x1,x2,,xm1,u1,u2,,un)(x1,x2,,xm1,i=1m1gxixii=1nguiuigxm,u1,u2,,un)
여기서 는 최대 점에서 평가 된 대한 의 부분 유도체를 나타낸다 . 이것은 레벨 세트의 탄젠트 공간에 대한 차원 공간 의 선형 맵입니다 . 이를 사용하여 원하는 적분을 계산할 수 있습니다. 먼저 형식의 풀백은 그 자체입니다.gxigxim+n1gdui

Hessian의 풀백은 이차 형태

Ti,j=Hi+m,j+m+guigujgxm2Hm,m\rm for 1<=i,j<=n

따라서 적분은 라플라스 근사법을 통해 계산 (또는 근사화) 될 수 있으며 , 이는 C 결정 ( Cholesky) 분해를 통해 계산되는 결정 요인의 로그를 포함하는 일반적인 공식 입니다. 적분의 라플라스 근사값은 여기서결정자입니다. 우리는 여전히 수준 세트의 폭을 다룰 필요가 로 이이 값을 갖는 첫 번째 순서로 여기서 는 의 부분 도함수의 벡터입니다. T

L(x^(s),u^(s))|T|12
||gϵ0ϵ/g(x^(s),u^(s))g(x^(s),u^(s)))g (gx1,gx2,,gxm,gu1,gu2,,gun) 레벨 세트의 우도 값 이 제공되도록 하여 이것은 프로파일 가능성을 계산하는 데 사용할 정확한 근사치입니다.g
L(x^(s),u^(s))|T|12g(x^(s),u^(s))
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.