선형 모형으로 일반적인 통계 검정


22

(업데이트 : 나는 이것에 대해 더 깊이 빠져들고 결과를 여기에 게시했습니다 )

명명 된 통계 테스트 목록은 엄청납니다. 많은 일반적인 테스트는 간단한 선형 모델의 추론에 의존합니다. 예를 들어 1- 표본 t- 테스트는 y = β + ε입니다. 이는 null 모델 y = μ + ε 에 대해 테스트됩니다. 즉, β = μ 인 경우 μ는 일부 null입니다 값-일반적으로 μ = 0.

나는 이것이 명명 된 모델 학습, 사용시기 및 서로 관련이없는 것처럼 가정을 가르치는 것보다 교육 목적에있어 상당히 유익한 것으로 생각합니다. 이러한 접근 방식은 이해를 촉진하지 않습니다. 그러나 이것을 수집하는 좋은 자료를 찾을 수 없습니다. 나는 기본 모델 간의 유추 방법보다는 기본 모델 간의 동등성에 더 관심이 있습니다. 내가 알 수있는 한,이 모든 선형 모형에 대한 우도 비 검정은 "고전적"추론과 동일한 결과를 산출합니다.

오류 항을 무시하고 모든 귀무 가설이 효과가 없다고 가정 할 때 까지 지금까지 내가 배웠던 동등성은 다음과 같습니다 .εN(0,σ2)

1 표본 t- 검정 : .y=β0H0:β0=0

대응 표본 t- 검정 : y2y1=β0H0:β0=0

이는 쌍별 차이에 대한 1- 표본 t- 검정과 동일합니다.

2- 표본 t- 검정 : y=β1xi+β0H0:β1=0

여기서 x는 표시기 (0 또는 1)입니다.

피어슨 상관 관계 : y=β1x+β0H0:β1=0

이진 x 축에서 단지 회귀 인 2- 표본 t- 검정과의 유사성을 주목하십시오.

Spearman 상관 관계 : rank(y)=β1rank(x)+β0H0:β1=0

이것은 순위 변환 된 x와 y에 대한 Pearson 상관 관계와 동일합니다.

일원 분산 분석 : y=β1x1+β2x2+β3x3+...H0:β1,β2,β3,...=β

여기서 는 관련 선택하는 지표입니다 (하나의 는 1, 다른 하나는 0). 모델은 아마도 와 같이 행렬 형식으로 작성 될 수 있습니다 .xiβxY=βX

양방향 분산 분석 : y=β1X1+β2X2+β3X1X2H0:β3=0

두 가지 두 가지 요소에 대해 여기서 는 인디케이터 벡터 의해 선택된 베타의 벡터입니다 . 여기서 도시는 작용 효과이다.βiXiH0

이 선형 모델 목록에 "명명 된 테스트"를 더 추가 할 수 있습니까? 예를 들어, 다변량 회귀, 기타 "비모수 적"검정, 이항 검정 또는 RM-ANOVA?

업데이트 : 여기 SO에 대한 선형 모델로서의 분산 분석 및 t- 검정에 대한 질문과 답변이 있습니다. 이 질문과 태그 관련 질문을 참조하십시오 .


1
나는 이러한 비교가 적절하다고 생각하지만 언젠가는 미묘한 차이점이 있습니다. 예를 들어 일원 분산 분석 : 선형 회귀 분석에서 계수를 제공하고 대부분의 소프트웨어 패키지에서 Wald 테스트 (적절하지 않을 수도 있음)를 사용하여 계수 당 의의를 나타내는 ANOVA는 단일 p- 값을 제공합니다. 계수 중 하나는 0과 크게 다릅니다. null 모델과 관심있는 회귀 모델 간의 우도 비율 검정이 더 비슷할 수 있습니다. 따라서 이러한 테스트 / 모델을 완전히 동일하게 만들지는 않습니다.
IWS

좋은 지적; 나는 그 질문을 업데이트하여 "저는 모델에서 추론 하는 방법보다는 기본 모델 간의 동등성에 더 관심이 있습니다." 일원 분산 분석 및 교호 작용 항에 대한 우도 비율 검정은 테스트가 진행되는 한 "고전"분석과 동일한 p- 값을 산출합니다.
Jonas Lindeløv

1
충분히 공정하지만 추론을 제외하고 회귀 모델은 비선형 성을 처리 할 때 (이러한 '명명 된 테스트'를 사용하여 변환을 테스트 할 수도 있지만 스플라인은 다른 문제임) 또는 이분산성을 처리 할 때 추가적인 유연성을 제공합니다. 비 연속 종속 변수도 처리하는 일반화 된 모델 그럼에도 불구하고, 나는 장점을 가질 수있다 목적을 가르치는 회귀 모델의 제한적인 변화로 명명 된 테스트를 설명 볼 수 있습니다 하나 때문에
IWS

1
Spearman 순위 상관 관계가 실제로 선형 모형입니까?
Martin Dietz

1
@MartinDietz : 예, x와 y를 순위 변환 한 후에는 선형입니다. R 코드 :x = rnorm(100); y = rnorm(100); summary(lm(rank(x) ~ rank(y))); cor.test(x, y, method='spearman')
Jonas Lindeløv

답변:


6

전체 목록은 아니지만 일반화 된 선형 모델 을 포함하면 이 문제의 범위가 상당히 커집니다.

예를 들어 :

E[logit(p)|t]=β0+β1tH0:β1=0

p×k

E[log(μ)]=β0+βi.+β.j+γiji,j>1H0:γij=0,i,j>1

또한 동일하지 않은 분산에 대한 t- 검정은 Huber White 강력한 오차 추정을 사용하여 근사화됩니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.