"올바른"GLM의 응답 스케일에 대한 모델 평균 예측을 계산하려면?
- 링크 스케일에서 모델 평균 예측을 계산 한 다음 응답 스케일로 역변환하거나
- 예측을 반응 척도로 다시 변환 한 다음 모형 평균을 계산합니다.
모델이 GLM 인 경우 예측은 비슷하지만 같지 않습니다. 다른 R 패키지는 둘 다에 대한 옵션을 제공합니다 (기본값이 다름). 몇몇 동료들은 "모든 사람들이 # 2를하기 때문에"# 1이 잘못되었다고 주장했다. 내 직감에 따르면 # 1은 모든 선형 수학을 선형으로 유지하기 때문에 "정확하다"고 말합니다 (# 2는 선형 스케일이 아닌 것을 평균합니다). 간단한 시뮬레이션을 통해 # 2는 # 1보다 MSE가 매우 작은 것으로 나타났습니다. # 2가 맞다면 그 이유는 무엇입니까? 그리고 # 2가 맞다면 왜 내 이유 (선형 수학을 선형으로 유지)가 나쁜 추론입니까?
편집 1 : GLM의 다른 요소 수준에 대한 한계 평균 계산은 위에서 묻는 질문과 비슷한 문제입니다. Russell Lenth는 # 1 (emmeans 패키지)의 "타이밍"(그의 말)을 사용하여 GLM 모델의 한계 평균을 계산하며 그의 주장은 직관과 비슷합니다.
편집 2 : 예측 (또는 계수)이 "최상의"중첩 모델의 전체 또는 부분 집합에 대한 가중 평균으로 추정되는 모델 선택의 대안을 참조하기 위해 모델 평균화를 사용하고 있습니다 (아래 참조 및 R 패키지 참조) .
주어진 중첩 모델 (여기서 은 모델 대한 개별 대한 선형 예측 (링크 공간에서) , 은 위의 # 1을 사용한 모델 평균 예측 인 대한 가중치입니다 (링크의 평균) 스케일링 후 응답 스케일로 역변환)은 다음과 같습니다.
위의 # 2를 사용한 모델 평균 예측 (모든 예측을 역변환 한 후 응답 스케일의 평균)은 다음과 같습니다.
모델 평균화의 일부 베이지안 및 빈번한 방법은 다음과 같습니다.
Hoeting, JA, Madigan, D., Raftery, AE and Volinsky, CT, 1999. 베이지안 모델 평균화 : 튜토리얼. 통계 과학, pp.382-401.
Burnham, KP and Anderson, DR, 2003. 모델 선택 및 다중 모델 추론 : 실용적인 정보 이론적 접근. 스프링거 과학 및 비즈니스 미디어.
Hansen, BE, 2007. 최소 제곱 모델 평균. 계량 경제학, 75 (4), pp.1175-1189.
Claeskens, G. and Hjort, NL, 2008. 모델 선택 및 모델 평균. 케임브리지 책.
R 패키지에는 BMA , MuMIn , BAS 및 AICcmodavg가 포함 됩니다. (참고 : 이것은 일반적으로 모델 평균화의 지혜에 대한 질문이 아닙니다.)