로그 연결 감마 GLM 대 로그 연결 가우시안 GLM 대 로그 변환 LM


13

내 결과에 따르면 GLM 감마가 대부분의 가정을 충족하는 것으로 보이지만 로그 변환 된 LM보다 가치있는 개선입니까? 내가 찾은 대부분의 문헌은 포아송 또는 이항 GLM과 관련이 있습니다. 나는 RANDOMIZATION을 사용한 일반 선형 모델 가정 평가의 기사가 매우 유용하다는 것을 알았지 만 결정을 내리는 데 사용 된 실제 도표는 부족하다. 다행히도 경험이있는 사람이 올바른 방향으로 나를 가리킬 수 있기를 바랍니다.

응답 변수 T의 분포를 모델링하고 싶습니다. 분포는 아래와 같습니다. 보시다시피, 양의 왜도
유효한 XHTML입니다.

고려해야 할 두 가지 범주 적 요소가 있습니다 : METH와 CASEPART.
이 연구는 주로 탐색 적이며 모델을 이론화하고 DoE를 수행하기 전에 파일럿 연구의 역할을합니다.

진단 플롯과 함께 R에 다음 모델이 있습니다.

LM.LOG<-lm(log10(T)~factor(METH)+factor(CASEPART),data=tdat)

유효한 XHTML
유효한 XHTML

GLM.GAMMA<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="Gamma"(link='log'))

유효한 XHTML
유효한 XHTML

GLM.GAUS<-glm(T~factor(METH)*factor(CASEPART),data=tdat,family="gaussian"(link='log'))

유효한 XHTML
유효한 XHTML

또한 잔존물에 대한 Shapiro-Wilks 테스트를 통해 다음 P- 값을 달성했습니다.

LM.LOG: 2.347e-11  
GLM.GAMMA: 0.6288  
GLM.GAUS:  0.6288  

AIC 및 BIC 값을 계산했지만 정확하다면 GLM / LM의 다른 제품군으로 인해 많은 것을 알려주지 않습니다.

또한 극단적 인 가치를 언급했지만 명확한 "특별한 원인"이 없기 때문에이를 특이 치로 분류 할 수 없습니다.



1
회귀의 증가가 전형적인 반응의 상대적인 변화와 관련이 있다는 점에서 세 가지 모델이 모두 곱해진다는 점은 주목할 가치가 있습니다. 두 개의 로그 선형 GLM의 경우 "일반"은 산술 평균을 의미하지만 로그 변환 LM의 경우 기하학적 평균에 대해 이야기합니다. 따라서 효과 및 예측을 해석하려는 방식도 완벽한 잔차 그림을 제공 할뿐만 아니라 데이터를 구동하는 모델 선택의 원동력이됩니다.
Michael M

@MichaelMayer-답변 주셔서 감사합니다, 매우 도움이되었습니다. 선택이 해석에 어떤 영향을 미치는지 정확히 설명해 주시겠습니까? 아니면 참조 방향으로 알려주십시오.
TLJ

@ Marcinthebox- 게시하기 전에 그 질문을 살펴 보았습니다. 내 질문에 매우 간결하게 대답하지 않습니다.
TLJ

답변:


19

가우시안에 대한 로그 선형 적합은 적합하지 않습니다. 잔차에는 강한 이분산성이 있습니다. 고려해 보도록합시다.

남은 것은 로그 정규 대 감마입니다.

T

이 경우 어느 모델이든 거의 동일하게 나타납니다. 둘 다 평균의 제곱에 비례하는 분산을 가지므로 적합치에 대한 잔차의 확산 패턴이 비슷합니다.

낮은 특이 치가 로그 정규보다 감마에 약간 더 적합합니다 (높은 특이 치의 경우 그 반대). 주어진 평균과 분산에서 대수 정규는 더 치우치고 변동 계수가 더 높습니다.

exp(μ)σ2

관련 토론에 대해서는 여기여기 를 참조하십시오 .


1
@Gleb_b이 답변은 내 분석에 매우 유용합니다. 몇 가지 질문이 있습니다. (1) 먼저,이 둘은 잔차 대 적합도를 기준으로 '둘 다 평균의 제곱에 비례하는 분산이 있습니까?'입니까? (2) 그리고 이것은 qq 플롯을 기반으로 한 '낮은 특이 치가 감마와 약간 더 잘 맞을 것입니다 ... 주어진 평균과 분산에서 ...'입니까? (3) 내가 이해 한 glm (예 : 감마, 포아송 및 음 이항)은 잔차의 정규성과 분산의 균질성을 가정하지 않습니다. 그렇다면 왜 잔차 대 적합치 및 정상 qq 도표가 진단과 관련이 있습니까?
tatami

2
이것은 완전히 새로운 질문이 될 수있을 정도로 광범위하며, 실제로 몇 가지 (대부분 우리 사이트에서 이미 답변을 받았습니다!)-1. 모델의 일부입니다. 2. 아니요, 배포판에 대한 일반적인 사실입니다. 3. 그것들이 정상적이지 않다고 정정하십시오. 그러나 QQ 플롯에 사용 된 잔차는 (내부적으로 학생 화 된) 이탈 잔차입니다. 특히 감마의 경우 일반적으로 정규 분포에 매우 가까운 경향이 있습니다. 일부 점) 본질적으로 일정한 분산을 가져야합니다. 정규성에서 약간의 편차는 예상치 못한 것이 아니라 상당한 편차 ... ctd
Glen_b-복지국 Monica

2
정규성에서 ctd ... (다른 도표가 양호하다고 가정)는 분포 가정에 문제가 있음을 나타낼 수 있습니다.
Glen_b-복지 주 모니카
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.