일반 선형 모형과 일반 선형 모형 (식별 링크 기능이 있는가?)


25

이것은 첫 번째 게시물이므로 일부 표준을 따르지 않으면 쉽게 받아 들일 수 있습니다. 내 질문을 검색했는데 아무 것도 나타나지 않았습니다.

내 질문은 주로 일반 선형 모델링 (GLM)과 일반 선형 모델링 (GZLM)의 실제 차이점과 관련이 있습니다. 제 경우에는 공변량으로 몇 가지 연속 변수가 있고 GZLM에 비해 ANCOVA에서 몇 가지 요소가 있습니다. 각 변수의 주요 효과와 모델에서 설명 할 3 가지 상호 작용을 살펴보고 싶습니다. 이 가설이 ANCOVA에서 또는 GZLM을 사용하여 테스트되고 있음을 알 수 있습니다. 어느 정도까지는 ANCOVA와 같은 일반 선형 모델을 실행하는 데 필요한 수학 프로세스와 추론을 이해하고 있으며 GZLM은 선형 모델과 종속 변수를 연결하는 링크 함수를 허용한다는 것을 이해합니다. 수학을 정말로 이해하십시오). 내가 진짜 뭘 GZLM에 사용 된 확률 분포가 정상일 때 (즉, 신원 링크 함수?) 한 분석을 실행하는 실제 차이점이나 이유는 이해하지 않는다. 다른 것을 실행할 때 매우 다른 결과를 얻습니다. 둘 중 하나를 실행할 수 있습니까? 내 데이터는 다소 비정규 적이지만 ANCOVA와 GZLM에서 어느 정도 작동합니다. 두 경우 모두 내 가설이 뒷받침되지만 GZLM에서는 p 값이 "더 좋습니다".

내 생각에 ANCOVA는 ID 링크 함수를 사용하여 정규 분포 분포 종속 변수가있는 선형 모델이라고 생각했는데 GZLM에 정확하게 입력 할 수 있지만 여전히 다릅니다.

가능하다면이 질문들에 대해 조금 알려주세요!


첫 번째 답변을 기반으로 추가 질문이 있습니다.

이들이 활용 한 유의성 검정 (예 : F 검정 대 Wald Chi Square)을 제외하고 동일하다면 어떤 것이 가장 적합합니까? ANCOVA는 "가는 방법"이지만 F 테스트가 왜 바람직한 지 잘 모르겠습니다. 누군가 나를 위해이 질문에 대해 밝힐 수 있습니까? 감사!


@onestop의 대답은 좋습니다. 나는 오래 전에 그것을 upvoted. 일반 선형 모델 및 사이의 연결을 명확하게 이해 얻으려면 일반화 : 선형 모델을, 당신이 여기 내 대답을 읽는 데 도움이 될 수 차이 - 사이 - 로짓 - 및 - 프로 빗 - 모델 (그것이 다른 컨텍스트로 작성되었지만) . 오류가 정상적으로 분포되어 있다고 가정하지만 오류 분산은 사전에 알려져 있지 않다고 가정하면 소프트웨어가 ANCOVA와 함께 반환 되는 & 테스트가 정확합니다. N이 매우 크지 않으면 Wald 검정의 p- 값이 너무 낮습니다. tF
gung-모니 티 복원

답변:


23

아이덴티티 링크 함수와 일반 패밀리 분포를 지정하는 일반화 된 선형 모델은 (일반) 선형 모델과 정확히 동일합니다. 각각 다른 결과를 얻는다면 뭔가 잘못한 것입니다.

신원 링크를 지정하는 것은 유의 하지 정규 분포를 지정하는 것과 같은 일이. 분포와 연결 함수는 일반화 된 선형 모형의 두 가지 구성 요소이며 각각 독립적으로 선택할 수 있습니다 (특정 링크는 특정 분포에서 더 잘 작동하지만 대부분의 소프트웨어 패키지는 각 분포에 허용되는 링크 선택을 지정합니다).

일부 소프트웨어 패키지는 모든 일반화 된 선형 모형에 대해 점근 법 정규 및 카이-제곱 분포를 사용하여 이들을 계산하면 잔류 자유도가 작은 경우 현저하게 다른 보고 할 수 있습니다 . 모든 소프트웨어는 일반 선형 모형 에 대한 스튜던트 및 Fisher 's 분포를 기반으로 값을보고합니다. 이는 무증상에 의존하지 않기 때문에 작은 잔류 자유도에 대해 더 정확하기 때문입니다. Student 's 및 Fisher 's distributions는 다른 가정에도 불구하고 정상적인 가족에게만 유효합니다.pptFtF 일반화 선형 모형 용 소프트웨어는 데이터에서 추정되는 척도 모수로 다른 패밀리를 피팅 할 때이를 근사치로 사용할 수도 있습니다.


당신의 답변에 감사드립니다! 그것이 나의 원래 가정 이었기 때문에 당신의 대답을 듣고 기쁩니다. 나는 나의 기관의 교수로부터 다른 말을 들었으므로 정말로 파고 가야했습니다. SPSS를 사용하고 있으며 이제 매개 변수 추정치가 실제로 동일하다는 것을 알 수 있습니다 (예 : B 값). 나는 원래 나를 혼란스럽게 한 것이 다른 p 값이라는 것을 알았다. ANCOVA 통계는 표준 F 검정을 기반으로하지만 GZLM은 Wald Chi-Square를 기반으로합니다. 샘플의 매개 변수 (예 : GZLM)를 사용할 때 Wald Chi-Square가 사용된다는 것을 읽었습니다.
Behacad

이 답변을 바탕으로 원래 게시물에 질문을 추가했습니다!
Behacad

좋아, 응답으로 해당 답변을 내 답변에 추가했습니다.
onestop

5

이 토론에 내 경험을 포함시키고 싶습니다. 일반화 선형 모형 (식별 링크 함수 및 정규 분포 분포 지정)이 최대 우도 추정치를 척도 모수 방법으로 사용하는 경우에만 일반 선형 모형과 동일하다는 것을 알았습니다. 그렇지 않으면 스케일 매개 변수 방법으로 "고정 값 = 1"을 선택하면 매우 다른 p 값을 얻게됩니다. 내 경험에 따르면 일반적으로 "고정 값 = 1"은 피해야합니다. 스케일 매개 변수 방법으로 고정 값 = 1을 선택하는 것이 적절한 지 누군가가 알고 있는지 궁금합니다. 미리 감사드립니다. 표


3
일반적으로 로지스틱 회귀 또는 포아송 회귀와 같은 모형에서만 고정 척도를 사용합니다. 여기서 반응은 개수 또는 지표 / 빈도 변수입니다. 이 경우 정규 회귀 분석에서 척도 모수와 유사하지 않습니다.
Hong Ooi
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.