분산 분석 (ANOVA)에서 단측 검정 F- 검정을 사용하는 이유는 무엇입니까?


13

분산 검정 분석에서 단측 검정을 사용하는 이유를 설명 할 수 있습니까?

왜 ANOVA에서 단측 검정 (F- 검정)을 사용합니까?


2
당신의 생각을 안내하는 몇 가지 질문 ... 매우 부정적인 통계는 무엇을 의미합니까? 음의 F 통계가 가능합니까? 매우 낮은 F 통계량은 무엇을 의미합니까? 높은 F 통계량은 무엇을 의미합니까?
russellpierce

단측 테스트가 F- 테스트 여야한다는 인상을받는 이유는 무엇입니까? 귀하의 질문에 대답하기 위해 : F- 검정은 하나 이상의 선형 매개 변수 조합으로 가설을 검정 할 수 있습니다.
IMA

1
왜 두 꼬리 테스트 대신 한 꼬리를 사용하는지 알고 싶습니까?
Jens Kouros

@tree 당신의 목적에 맞는 믿을만한 또는 공식적인 출처는 무엇입니까?
Glen_b-복지 주 모니카

1
@tree 참고 여기서 신데렐라의 질문 은 분산 검정에 대한 것이 아니라 분산의 F- 검정- 평균의 평등에 대한 검정입니다 . 분산의 동등성 검정에 관심이있는 경우이 사이트의 다른 많은 질문에서 논의되었습니다. (분산 테스트의 경우 예, ' 속성 ' 바로 위 의이 섹션 의 마지막 문장에서 명확하게 설명 된대로 두 꼬리를 모두 처리합니다 )
Glen_b -Reinstate Monica

답변:


17

F 테스트는 두 가지 목적으로 가장 일반적으로 사용됩니다.

  1. 평균의 평등 (및 다양한 유사한 분석)을 테스트하기 위해 ANOVA에서; 과

  2. 분산의 동등성을 테스트 할 때

각각을 차례로 고려해 봅시다.

1) ANOVA에서의 F 검정 (및 유사하게 카운트 데이터에 대한 일반적인 종류의 카이-제곱 검정)은 데이터가 대립 가설과 일치할수록 검정 통계량은 커지는 반면 표본의 배열은 커지도록 구성됩니다. 널과 가장 일관되게 보이는 데이터는 검정 통계량의 가장 작은 값에 해당합니다.

동일한 표본 분산을 갖는 크기가 10 인 세 개의 표본을 고려하여 동일한 표본 평균을 갖도록 정렬 한 다음 평균을 다른 패턴으로 이동하십시오. 표본 평균의 변동이 0에서 증가함에 따라 F 통계량은 커집니다.

3 개의 표본 배열 및 해당 F 통계량

검은 선 (||

귀무 가설 (인구 평균의 평등)이 true 인 경우 표본 평균에 약간의 차이가있을 것으로 예상되며 일반적으로 약 1 정도의 F 비율을 볼 것으로 예상됩니다. 작은 F 통계량은 일반적으로 비교 한 표본보다 더 가까운 표본에서 비롯됩니다. 기대 ... 그래서 당신은 인구 평균이 다르다는 결론을 내리지 않을 것입니다.

즉, 비정상적으로 큰 F-값을 얻을 때 ANOVA를 들어, 수단의 평등의 가설을 기각 것, 그리고 당신이 비정상적으로 작은 값 (이 나타낼 수 있습니다 얻을 때 당신은 수단의 평등의 가설을 기각하지 않습니다 뭔가를 하지만,하지를 인구가 다르다는 것을 의미합니다).

다음은 F가 위쪽 꼬리에있을 때만 거부하고 싶다는 것을 보여주는 그림입니다.

ANOVA에 대한 F의 설명, F- 통계가 상단에있을 때 기각

2) F의 분산이 동일한 지 검정합니다 (분산 비율을 기준으로 함). 여기에서 분자 표본 분산이 분모의 분산보다 훨씬 크면 두 표본 분산 추정치의 비율이 커지고 분모 표본 분산이 분자의 분산보다 훨씬 크면 비율이 작아집니다.

즉, 모집단 분산의 비율이 1과 다른지 테스트하기 위해 F의 크거나 작은 값 모두에 대해 null을 거부하려고합니다.

* (이 테스트의 분포 가정에 대한 높은 민감성 문제를 제외하고 (더 나은 대안이 있음) ANOVA 등분 산 가정의 적합성에 관심이 있다면 최선의 전략이 아닐 수도 있습니다 공식 시험.)


2
@TaylerJones Levene의 테스트는 다소 강력합니다. Browne-Forsythe는 더 강력하지만 정상 근처에서 약간의 전력을 잃습니다. 다시 Fligner-Killeen. 수십 년 동안 나는 Levene 또는 Browne-Forsythe를 두 번 이상 사용하지 않았습니다. (다시 나온다면 Browne-Forsythe와 같은 것이 나에게 적합 할 것 같지만 일반적으로 여러 그룹의 편차를 평등에 대해 테스트하는 것이 의미가없는 상황은 없습니다.)
Glen_b -Reinstate Monica

2
F=MSTREATMENTMSERROR1F

2
@tree 가설 테스트에 대해 더 일반적으로 이해하지 못하는 것처럼 들리지만 정확히 어디에 있는지 확실하게 알기가 어렵습니다. 당신은 당신이 큰 F를 받으면 거부하고 작은 F를 얻으면 거부하고 싶지 않다는 것을 이해합니다. F의 큰 값은 위쪽 꼬리에있는 값이고, F의 작은 값은 아래쪽 꼬리에있는 값입니다. 값이 클 때만 (즉, 위쪽 꼬리가 아니라 아래쪽 꼬리) 거부합니다. 꼬리가 어떻게 보이는지 어떻게 알 수 있습니까? 도움이 될만한 다른 음모를 포함시킬 것입니다.
Glen_b-복지 주 모니카

1
@jeramy 내 의견은 분산 비율에 의존하는 검정을 말합니다 (특히, " 두 표본 분산 추정치의 비율은 다음과 같습니다 "). 이 테스트에서는 스프레드의 차이를 파악하기 위해 일부 위치 측정 값에서 절대 잔차의 위치 차이를 찾습니다. 그들은 자연스럽게 위치 차이에 대한 테스트 방식을 작동합니다. 당신이 경우 보여 주려 된 이래 은 F의 낮은 꼬리보고를, 브라운 - 포사이드 (다른 테스트는 추론 확산의 차이에 편차가 어느 정도의 위치 차이보기는) 어쩔 수 없을 것이다
Glen_b -복지 상태 모니카

1
@jeramy 나는 좀 더 명확하게하기 위해 몇 단어를 추가했습니다. Brown-Forsythe, Levene 등이 F- 테이블 을 사용 하더라도 테스트 통계의 분포는 테스트의 가정 하에서도 실제로 F- 분포되지 않습니다.
Glen_b-복지 주 모니카

2

분산 분석의 목적은 평균의 불평등이 있는지 여부를 확인하는 것입니다 ... 샘플 내의 변동과 비교할 때 표본 간의 큰 변동 (및 변동이 평균에서 계산되는 평균)에 관심이 있음을 의미합니다. (다시 개별 표본 평균에서 계산). 샘플들 사이의 변동이 적을 때 (F 값이 왼쪽에 있음),이 차이는 중요하지 않으므로 중요하지 않습니다. 내부 편차보다 유의하게 높은 경우 샘플 간 편차가 중요하며,이 경우 F 값이 1보다 커서 오른쪽 꼬리가됩니다.

유일하게 남아있는 유일한 질문은 왜 전체 꼬리의 중요성을 오른쪽 꼬리에두고 답이 다시 비슷한 지에 대한 것입니다. 거부는 F 비율이 오른쪽에있을 때만 발생하고 F 비율이 왼쪽에있을 때는 절대 발생하지 않습니다. 유의 수준은 통계적 한계로 인한 오차 측정입니다. 거부가 오른쪽에서만 발생하기 때문에 전체 의미 수준 (오해 결론의 오류 위험)이 오른쪽에 유지됩니다. `


0

처리 내 평균 제곱 (MS)에 대한 예상 값은 모집단 분산이고, 처리 간 MS에 대한 예상 값은 모집단 분산에 처리 분산을 더한 값입니다. 따라서 F = MSbetween / MSwithin의 비율은 항상 1보다 크고 1보다 작지 않습니다.

단측 테스트의 정확도는 양측 테스트보다 낫기 때문에 단측 테스트를 사용하는 것이 좋습니다.


첫 번째 단락의 마지막 문장에 대한 주장이 정확하다고 생각하지 않습니다 ... E (분자)> E (분모)는 분자> 분모를 암시하지 않습니다.
Glen_b-복지 주 모니카

Glen_b의 입장을 제외하고는 "단일 테스트의 정확도가 2 테일 테스트보다 낫기 때문에 1 테일 테스트를 사용하는 것을 선호합니다"라고 확신 할 수 없습니다. 이것의 의미를 설명 할 수 있습니까? 정확성에 대해 이야기하면 요점을 놓치는 것 같습니다.
실버 피쉬

정밀도는 반 신뢰 구간과 같습니다. 동일한 F-stat의 경우 1- 꼬리 검정은 더 작은 p- 값 (사실 반)으로 귀무 가설을 기각합니다. 다른 방법으로 1 테일 테스트는 더 작은 F-stat 값으로 귀무 가설을 기각 할 수 있습니다. 이는 1 테일 테스트가 더 적은 수의 샘플 또는 더 일반적인 샘플에 존재하는 원인 변동으로 처리 효과를 감지 할 수 있음을 의미합니다. 이것은 효과를 찾고 있다면 1 테일 테스트가 더 바람직합니다.
Jeff Cotter

예, 계산 된 F 통계량은 1.0보다 작을 수 있습니다. 그러나 결론은 "치료 효과 없음"이라는 귀무 가설을 기각 할 수 없을 것입니다. 따라서 아래쪽 꼬리에는 중요한 영역이 없습니다. 따라서 F- 검정은 상단 단측 검정입니다. ANOVA에서 논리 인수는 MS_treat 및 MS_error에 대한 예상 값을 기반으로합니다. "치료 효과 없음"가설 하에서, H0 : E (MS_treat) = E (MS_error) = 모집단 분산. 치료 효과가 현저하면 HA : E (MS_treat)> E (MS_error)가 발생합니다. (ANOVA를 포함하는 몽고메리 텍스트를 소싱하십시오). 따라서 HA는 단측 테스트를 의미합니다.
Jeff Cotter
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.