그것들은 모두 동일한 기본 통계 방법의 버전입니까?
그것들은 모두 동일한 기본 통계 방법의 버전입니까?
답변:
그것들은 모두 회귀 방정식으로 쓰여질 수 있습니다 (아마도 전통적인 형태와 약간 다른 해석이있을 수 있음).
회귀 :
t- 검정 :
분산 분석 :
프로토 타입 회귀는 를 연속 변수로 개념화 합니다. 그러나 실제로 에 대해 만들어진 유일한 가정 은 알려진 상수로 구성된 벡터라는 것입니다. 연속 변수 일 수도 있지만 더미 코드 일 수도 있습니다 (즉, 관찰이 표시된 그룹 (예 : 치료 그룹)의 구성원인지 여부를 나타내는 과 의 벡터 ). 따라서 두 번째 방정식에서 는 이러한 더미 코드 일 수 있으며 p- 값은보다 전통적인 형태의 t- 검정과 동일합니다. X 0 1 X
그러나 베타의 의미는 여기에서 다릅니다. 이 경우 은 제어 그룹의 평균이되고 (더미 변수의 항목은 ) 은 처리 그룹의 평균과 제어 평균의 차이입니다. 그룹. 0 β 1
이제 t- 테스트가 더 일반적 일지라도 두 그룹만으로 분산 분석을 수행 / 실행하는 것이 합리적이며 세 그룹이 모두 연결되어 있음을 기억하십시오. 3 개의 그룹이있는 분산 분석이있는 경우 작동 방식을 선호하는 경우 그것이 될 것이다 : 그룹 이있을 때 , 그것들을 나타내는 더미 코드가 있습니다. 참조 그룹 (일반적으로 컨트롤 그룹)은 모두에 대해 표시됩니다.g g - 1 0 β 0 β 1 β 2
아래 @whuber의 의견에 비추어, 이것들은 행렬 방정식을 통해서도 표현 될 수 있습니다 :
이런 식으로 표현되는 & 은 길이 벡터입니다 및 길이의 벡터이고, . 는 이제 개의 행과 열이 있는 행렬입니다 . 원형 회귀 분석에는 연속 변수와 절편이 있습니다. 따라서, 사용자의 행렬 열의 일련의 구성되어 각각 나란히 한 벡터
이런 식 으로 그룹으로 분산 분석을 나타내는 경우 그룹을 나타내는 더미 변수가 있고 참조 그룹은 각 더미 변수에서 을 가진 관측치로 표시됩니다 . 위와 같이 여전히 가로 챌 수 있습니다. 따라서, 이다.
그것들은 모두 일반적인 선형 모델의 특별한 경우로 쓰여질 수 있습니다.
t- 검정은 ANOVA의 2- 표본 경우입니다. t- 검정 통계량을 제곱 하면 분산 분석에 해당 됩니다.
분산 분석 모형은 기본적으로 요인 수준이 더미 (또는 지표 ) 변수로 표시 되는 회귀 모형 입니다.
따라서 t- 검정에 대한 모형이 ANOVA 모형의 부분 집합이고 ANOVA가 다중 회귀 모형의 부분 집합 인 경우 회귀 자체 (및 회귀 이외의 다른 것)는 일반 선형 모형 의 부분 집합으로 회귀를 일반적인 회귀 분석 ( '독립'및 '동일 분산')보다 오류 항에 대한보다 일반적인 사양 및 다변량 입니다.
다음 은 R에서 수행 된 회귀 모델 의 정규 (등분 산) 두 표본 분석과 가설 검정 의 동등성을 보여주는 예입니다 (실제 데이터는 쌍을 이루는 것으로 보이므로 실제로는 적절한 분석이 아닙니다) :
> t.test(extra ~ group, var.equal=TRUE, data = sleep)
Two Sample t-test
data: extra by group
t = -1.8608, df = 18, p-value = 0.07919
alternative hypothesis: true difference in means is not equal to 0
95 percent confidence interval:
-3.363874 0.203874
sample estimates:
mean in group 1 mean in group 2
0.75 2.33
위의 p- 값은 0.079입니다. 편도 anova는 다음과 같습니다.
> summary(aov(extra~group,sleep))
Df Sum Sq Mean Sq F value Pr(>F)
group 1 12.48 12.482 3.463 0.0792
Residuals 18 64.89 3.605
이제 회귀
> summary(lm(extra ~ group, data = sleep))
(일부 출력 제거)
Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) 0.7500 0.6004 1.249 0.2276
group2 1.5800 0.8491 1.861 0.0792 .
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1
Residual standard error: 1.899 on 18 degrees of freedom
Multiple R-squared: 0.1613, Adjusted R-squared: 0.1147
F-statistic: 3.463 on 1 and 18 DF, p-value: 0.07919
'group2'행의 p- 값과 마지막 행의 F- 검정에 대한 p- 값을 비교하십시오. 양측 테스트의 경우, 이들은 동일하며 둘 다 t- 테스트 결과와 일치합니다.
또한, 'group2'에 대한 계수는 두 그룹에 대한 평균의 차이를 나타냅니다.