분산 분석에서 F- 및 p- 값을 해석하는 방법은 무엇입니까?


40

통계에 익숙하지 않으며 현재 분산 분석을 처리합니다. R을 사용하여 ANOVA 분석을 수행합니다.

aov(dependendVar ~ IndependendVar)

나는 다른 것들 중에서도 F 값과 p 값을 얻는다.

내 귀무 가설 ( ) 모든 그룹 수단은 동일하다는 것이다.H0

F 계산 방법대한 많은 정보 있지만 F- 통계를 읽는 방법과 F와 p가 연결되는 방법을 모르겠습니다.

그래서 내 질문은 :

  1. 기각에 대한 임계 F- 값을 어떻게 결정 합니까?H0
  2. 각 F에는 대응하는 p- 값이 있으므로 둘 다 기본적으로 동일합니까? (예를 들어, 인 경우 , H 0 은 기각 됨)p<0.05H0

1
당신은 명령 시도 summary(aov(dependendVar ~ IndependendVar)))또는 summary(lm(dependendVar ~ IndependendVar))? 모든 그룹 평균이 서로 같고 0 또는 서로 같음을 의미합니까?
RyanB 2016 년

네, 시도했습니다 summary(aov...). 에 대해 감사합니다 lm.*, 이것에 대해 몰랐습니다 :-) 0과 같은 의미를 얻지 못합니다. 가설보다 내 가설이 짧다면 값이 필요하고 특정 값을 테스트하지 않았습니다. 따라서이 경우 : 서로에게만!
JanD

1
직관적 인 설명을 보려면 회귀 주제에 대한 Yhat 블로그를 보십시오 .
DataTx

답변:


14

질문에 대답하려면 :

  1. F 분포 (여기서는 ) 에서 임계 F 값을 찾습니다 . 예를 참조하십시오 . 분자와 분모의 단방향 대 양방향 자유도에주의해야합니다.

  2. 예.


F- 테스트와 같은 옴니버스 테스트에서 단방향 또는 양방향 비교에 대해 이야기하는 것은 의미가 없습니다.
Marcus Morrisey

3
Marcus Morrisey : 하나의 꼬리와 두 개의 꼬리를 하나의 vs. 양방향으로 혼동하고 있다고 생각합니다. F- 검정에는 선택할 수있는 여러 "꼬리"가 없지만 검정 통계량을 구성 할 때 단방향 분산 분석 대 양방향 분산 분석을 고려해야합니다.
Emiller

29

F 통계량은 데이터에 대한 두 가지 다른 분산 측정 비율입니다. 귀무 가설이 참이면 모두 동일한 추정치이며 비율은 약 1입니다.

분자는 평균의 분산을 측정하여 계산되며 그룹의 실제 평균이 동일한 경우 이는 데이터의 전체 분산의 함수입니다. 그러나 귀무 가설이 거짓이고 평균이 모두 같지 않은 경우이 분산 측정 값이 더 커집니다.

분모는 각 그룹에 대한 표본 분산의 평균입니다. 이는 전체 모집단 분산의 추정치입니다 (모든 그룹에 동일한 분산이 있다고 가정).

따라서 모든 평균의 널이 같으면 두 측정 값 (자유도에 대한 추가 용어 포함)이 비슷하고 비율이 1에 가까워집니다. 널이 거짓 인 경우 분자는 분모와 비율은 1보다 큽니다. F- 테이블에서이 비율을 찾거나 R에서 pf와 같은 함수로 계산하면 p- 값이 제공됩니다.

p- 값보다 기각 영역을 사용하려면 R (또는 다른 소프트웨어)에서 F 테이블 또는 qf 함수를 사용할 수 있습니다. F 분포에는 두 가지 유형의 자유도가 있습니다. 분자 자유도는 비교할 그룹의 수 (1-way의 경우 그룹 수에서 1을 뺀 값)를 기준으로하고 분모 자유도는 그룹 내 관측 값을 기반으로합니다 (1- 방법은 관측치 수에서 그룹 수를 뺀 것입니다). 더 복잡한 모델의 경우 자유도는 더 복잡해 지지만 유사한 아이디어를 따릅니다.


설명 주셔서 감사합니다! p- 값을보기 위해 테이블에서 F 값을 조회 할 수 있다면 p와 F는 H0이 옳다면 분석 된 것과 같은 결과가 발생할 가능성을 나타내는 두 가지 방법 일 뿐이라고 생각합니다.
JanD

2
모든 매개 변수 통계에는 검정 통계량 (이 경우 F)과 p- 값 사이에 직접적인 기능적 링크가 있습니다. 이들은 편의상 테이블에 넣었지만 직접 계산할 수도 있습니다. 알파를 사용하여 임계 영역에서 컷을 찾아 테스트 통계를 비교하고 (보다 직관적이라고 생각) 계산 된 테스트 통계를 사용하여 알파와 비교할 p- 값을 찾을 수 있습니다. 두 경우 모두 알파 수준과 null이 참일 때 주어진 분포를 따르는 검정 통계량 공식으로 시작합니다.
Greg Snow

20

, p 및 임계 값 사이의 관계를 생각하는 가장 좋은 방법 은 사진을 사용하는 것입니다.Fp

여기에 이미지 설명을 입력하십시오

FFFpFFp에프

귀무 가설 하의 분포에 대한 몇 가지 다른 점을 주목해야합니다.

에프

에프

에프=0.175

에프에프에프1=에프1=2

여기에 이미지 설명을 입력하십시오

에프χ2χ2에프χ2에프

그것은 내가 타이핑하려는 것보다 훨씬 많지만, 그것이 귀하의 질문에 적용되기를 바랍니다.

(다이어그램의 출처가 궁금하다면 내 데스크탑 통계 패키지 Wizard에 의해 자동으로 생성됩니다 .)

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.