3 개의 표본에 대한 비율의 동등성에 대한 가설 검정


9

두 열이있는 휴대 전화 고객 정보 데이터의 데이터 세트가 있습니다. 첫 번째 열에는 계정이 속하는 특정 범주 (A, B 또는 C)가 포함되고 두 번째 열에는 계정이 취소되었는지 여부에 따라 이진 값이 포함됩니다. 예 :

A | cancelled
C | active
B | active
A | cancelled

내가하고 싶은 것은 A, B 및 C 유형의 계정 비율이 활성 계정과 취소 된 계정에 대해 다른지 여부를 테스트하는 일종의 가설 테스트를 제시하는 것입니다.이 가정은 동일하다는 것입니다. 따라서 3 가지 값에 대해이 작업을 수행하는 방법을 모른다는 점을 제외하고 비율에 대한 가설 검정과 같습니다.


6
테스트를 사용하여 세 그룹의 비율이 동일한 지 테스트 할 수 있습니다 . χ2

나는 또한 내가 세 가지 가설을 할 수있는 생각하고있어 서로 다른 있는지 확인하기 위해 C 대 B, C 대 B와 A,을 대를 테스트
user1893354가

5
다중 비교 문제를 해결해야 할 수도 있습니다.

답변 주셔서 감사합니다. 여러 비교 문제로 무슨 의미인지 궁금합니다. 더 구체적으로, 왜 세 가지 가설 검정 방법이 불리한가? 감사!
user1893354

3
세 가지 가설 검정을 사용할 때 두 가지 문제점이 있습니다. 첫째, 각 쌍이 일부 데이터를 재사용하기 때문에 상호 의존적입니다. 둘째, 경우에 그들은, 실제로 독립했다 후 널 (null)에 해당하는 경우에도 그 중 적어도 하나가 중요 할 것이라는 가능성 - 즉, 가양 오류의 가능성이 - 원하는 거짓에 비해 거의 3 배 더 큰 것 긍정적 인 비율. 두 번째 문제는 테스트를 조정해야한다는 것을 나타내지 만 첫 번째 문제는 적절한 조정을 찾는 것이 문제가 될 수 있음을 보여줍니다. 접근 방식은 이러한 문제를 방지 할 수 있습니다. χ2
whuber

답변:


13

나는 일반적으로 내 대답을 기반으로하고 문제가 테스트 프레임 워크에 어떻게 적용되는지에 대한 의견을 삽입합니다. 일반적으로 일반적인 귀무 가설 이 다음과 같은 테스트를 사용하여 비율이 동일한 지 테스트 할 수 있습니다 .χ2H0

H0:p1=p2=...=pk

즉, 모든 비율이 서로 같습니다. 이제 귀하의 경우 귀무 가설은 다음과 같습니다.

H0:p1=p2=p3
이고 대립 가설은
HA: at leat one pi is different for i=1,2,3

지금 수행하기 위해 χ2 테스트 다음 테스트 통계를 계산해야합니다. 테스트 통계 값은 다음과 같습니다.

χ2=i=1n(OiEi)2Ei

어디

  • χ2 = Pearson의 누적 검정 통계량으로, 무조건 분포에 접근합니다.χ2
  • Oi = 관측 된 주파수
  • Ei = 귀무 가설에 의해 주장되는 예상 (이론적) 주파수
  • n = 테이블의 셀 수

귀하의 경우 이므로이 문제를 다음 표로 생각할 수 있습니다. n=6여기에 이미지 설명을 입력하십시오

테스트 통계를 얻은 후에는 가설 테스트를 완료하는 방법에 대한 두 가지 옵션이 있습니다.

옵션 1) 검정 정적 를 귀무 가설 하의 적절한 임계 값 과 비교할 수 있습니다 . 즉, 이 참이면 행과 열이 있는 우발성 테이블 의 통계량은 도의 분포를 가져야합니다. 자유. 우리의 임계 값 계산 후 우리는 경우 우리는 귀무 가설을 거부합니다. 분명히 이면 귀무 가설을 기각 할 수 없습니다. χ2H0χ2RCχ2(R1)×(C1)χχ2>χχ2χ

그래픽으로 (모든 숫자가 구성됨) 다음과 같습니다. 여기에 이미지 설명을 입력하십시오

그래프에서 검정 통계량 가 파란색 검정 통계량에 해당하는 경우이 검정 통계량이 임계 영역에 포함되지 않기 때문에 귀무 가설을 기각 할 수 없습니다 (예 : ). 또는 녹색 검정 통계량은 임계 영역에 속하므로 녹색 검정 통계량을 계산하면 귀무 가설을 기각 할 수 있습니다.χ2χ2<χ

귀하의 예에서 자유도는

df=(R1)×(C1)=(21)×(31)=1×2=2

옵션 2) 귀무 가설 하에서 검정 통계량과 관련된 p- 값을 계산할 수 있으며이 p- 값이 지정된 -level 보다 작 으면 귀무 가설을 기각 할 수 있습니다. p- 값이 수준 보다 크면 귀무 가설을 기각 할 수 없습니다. p- 값은 분포가 검정 통계량보다 클 확률입니다.ααχ(R1)×(C1)2

그래픽으로 우리는 여기에 이미지 설명을 입력하십시오

여기서 p- 값은 테스트 통계량보다 큰 영역 (예제에서 파란색 음영 영역)으로 계산됩니다.

따라서 이면 귀무 가설 을 기각하지 않으면α>p-valueH0

경우 귀무 가설 거부αp-valueH0

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.