모집단의 중앙값을 테스트하는 방법?


9

250 단위의 샘플이 있습니다. 분포는 비대칭입니다. 모집단의 중앙값이 3.5와 다르다는 가설을 검정하고 싶습니다. 따라서 1- 표본 검정이 적합하다고 생각합니다. 분포가 대칭이 아니기 때문에 Wilcoxon 순위 검정이 적합하지 않다는 것을 알고 있습니다. 부호 테스트가 사용하기에 적합합니까? 만약 누군가가 다른 시험을 추천 할 수 없다면?


3
몇 가지 이유로 첫 줄에서 나를 잃었습니다. (1) 표본은 가우스 분포를 가질 수 없습니다 (그러나 대략 분포를 가질 수 있음). (2) 모든 가우시안 분포 (따라서 근사치 )의 한 가지 특성 은 대칭 입니다. 당신은 자신을 모순했습니다. 통계 전문 용어가 아닌 자신의 용어로 데이터를 설명하면 자신이 가진 것을 더 잘 전달할 수 있습니다. 또한 데이터를 통해 실제로 달성하고자하는 것을 가능한 한 명확하게 설명 할 수 있습니까? "중앙에 기반한 샘플 테스트"는 어떤 정보를 제공하기위한 것입니까?
whuber

1
샘플의 중앙값은 무엇이든 상관 없습니다. 그것을 테스트 할 필요가 없습니다. 아마도 모집단 의 중간 값 (시료를 얻는 기준)이 같은지 테스트하고 싶을 것입니다3.5? 그렇다면 어떻게 가치가 있는지 아는 것이 중요합니다3.5개발되었습니다. 아마도 다른 데이터 세트의 요약입니까? 아니면 품질 표준과 같은 미리 정해진 숫자입니까?
whuber

1
그것은 미리 정해진 번호
LeonRupnik

2
" 분포는 비대칭이므로 모집단의 중앙값이 3.5와 다른 경우 가설을 검정하고 싶습니다 ..."-표본의 비대칭 성이 왜 가설이 흥미로운 지에 영향을 미치게되는 이유는 무엇입니까?" 부호 테스트를 사용하기에 적합합니까? "-확실하지만 (최소한 원래 형태로) 연속성에 의존합니다. 변수가 이산 형인 경우 (데이터가 무엇인지 구성하지 않은 경우) 조정해야합니다. .
Glen_b-복지 주 모니카

데이터는 연속적입니다
LeonRupnik

답변:


8

개요

초과하는 데이터 수 3.5 확률이 알려지지 않은 이항 분포 . 이것을 사용하여 이항 테스트를 수행하십시오.=1/2 대안에 대하여 1/2.

이 포스트의 나머지 부분에서는 기본 모델을 설명하고 계산을 수행하는 방법을 보여줍니다. R그것들을 수행하기 위한 작업 코드를 제공합니다 . 기본 가설 검정 이론의 확장 된 계정이 제공됩니다 에 내 대답은 "통계 테스트에서 P-값과 t-값의 의미는 무엇입니까?" .

통계 모델

가치가 합리적으로 다양하다고 가정하면 3.5), 귀무 가설 하에서 임의로 샘플링 된 값은 1/2=50% 초과 확률 3.5 (이후 3.5인구의 중간 가치로 특징 지워집니다). 모두 가정250 값은 무작위로 독립적으로 샘플링되었으며 그 수는 3.5 그러므로 이항을 가질 것이다(250,1/2)분포. 이 번호를 "카운트"라고하겠습니다.케이.

반면에 모집단 중앙값이 다른 경우 3.5임의로 샘플링 된 값을 초과 할 가능성 3.5 ~와 다를 것이다 1/2. 이것은 대립 가설입니다.

적합한 테스트 찾기

널 상황을 다른 대안과 구별하는 가장 좋은 방법은 다음과 같은 값을 보는 것입니다. 케이그것은 null 아래에있을 가능성이 높고 대안 아래에는 거의 없습니다. 이들은 근처의 값입니다1/2250, 동일 125. 따라서 테스트에 중요한 영역 은 상대적으로 멀리 떨어진 값으로 구성됩니다.125: 가까운 0 또는 가까이 250. 그러나 얼마나 멀리125 그들은 다음과 같은 중요한 증거를 구성해야합니다. 3.5 인구 중앙값이 아닙니까?

에서는 의미의 표준에 따라 달라집니다 : 이 호출되는 테스트 크기 종종 되나,α. 귀무 가설 하에서 다음에 가까워 야합니다.α 그 기회 케이 중요한 지역에있을 것입니다.

일반적으로 어떤 대안을 적용 할 것인지에 대한 선입견이없는 경우 3.5-우리는 그 기회의 절반이되도록 중요 지역을 건설하려고 노력합니다. α/2, 그 케이 나머지 절반은 α/2, 그 케이높다. 우리는 분포를 알고 있기 때문에케이 귀무 가설 하에서이 정보는 임계 영역을 결정하기에 충분합니다.

기술적으로 계산을 수행하는 두 가지 일반적인 방법이 있습니다. 이항 확률을 계산하거나 정규 분포로 근사값을 구합니다.

이항 확률을 사용한 계산

백분율 포인트 (사 분위수) 기능을 사용하십시오. 예 R를 들어,에서 qbinom호출되고 다음과 같이 호출됩니다.

alpha <- 0.05 # Test size
c(qbinom(alpha/2, 250, 1/2)-1, qbinom(1-alpha/2, 250, 1/2)+1)

에 대한 출력 α=0.05 이다

109 141

이는 임계 영역이 모든 낮은 값으로 구성됨을 의미합니다. 케이 사이 (포함) 0109모든 높은 가치와 함께 케이 사이 (포함) 141250. 점검으로, 널이 참일 때 해당 지역에있을 R확률을 계산 하도록 요청할 수 있습니다 k.

pbinom(109, 250, 1/2) + (1-pbinom(141-1, 250, 1/2))

출력은 0.0497, 매우 크지 않은 –α그 자체. 임계 영역은 정수로 끝나야하므로 일반적으로이 실제 테스트 크기를 공칭 테스트 크기 와 정확히 동일하게 만들 수는 없습니다.α그러나이 경우 두 값은 실제로 매우 가깝습니다.

정규 근사를 사용한 계산

이항의 평균(250,1/2) 분포는 250×1/2=125 그리고 그 차이는 250×1/2×(11/2)=250/4표준 편차를 250/47.9. 이항 분포를 정규 분포로 바꿉니다. 표준 정규 분포는α/2=0.05/2 그것의 확률보다 작은 1.95996R명령 으로 계산 된

qnorm(alpha/2)

정규 분포는 대칭이므로 0.05/2 보다 큰 확률로 +1.95996. 따라서 임계 영역은k 그 이상 1.95996 표준 편차 125. 이 임계 값을 계산하십시오.125±7.9×1.96109.5,140.5. 계산은 다음과 같이 한 번에 수행 할 수 있습니다

250*1/2 + sqrt(250*1/2*(1-1/2)) * qnorm(alpha/2) * c(1,-1)

이후 k 정수 여야합니다. 중요한 지역에 속할 때 109 이하 141이상. 이 답변은 정확한 이항 계산을 사용하여 얻은 것과 동일합니다. 이것은 일반적으로p 더 가까이 1/2 ~보다 0 또는 1, 표본 크기는 보통에서 큰 (수십 이상)이며 α 아주 작지 않습니다 (몇 퍼센트).


이 테스트 는 모집단에 대해 아무 것도 가정 하지 않기 때문에 (중앙값에 초점을 맞출 가능성이 많지 않다는 점을 제외하고) 모집단에 대한 특정 가정을 만드는 다른 테스트만큼 강력하지 않습니다. 그럼에도 불구하고 테스트에서 null을 거부하면 전력 부족에 대해 걱정할 필요가 없습니다. 그렇지 않으면, 당신이 기꺼이 생각 하는 것과 인구에 대해 결론내릴 수있는 것 사이에 섬세한 절충점을 만들어야 합니다.


2
이것은 실질적으로 동일한 철학을 뒷받침 할뿐만 아니라 답이 구성되는 방식에서 p- 값 " 의 다소 추상적 인 의미의 효과적인 예이므로 , 나는 그것을 연결해야한다고 생각한다. 이것이 실제로 어떻게 적용되는지는 당신의 대답의 결론에서 ... ")에 대한 나의 대답에서 찾을 수 있습니다.
Silverfish

2
@ 실버 감사합니다; 실제로 내 마음을 넘어갔습니다. 조금 기다려야겠다고 생각했습니다. 무엇보다 진취적인 커뮤니티 회원이 중복 스레드를 파헤쳐 서 더 자세히 살펴보고 싶더라도 놀라지 않을 것입니다. 결국 이것은 기본 자료입니다. 이항 테스트에 대한 많은 질문이 있습니다. 이것이 새로운 것이되어야 할 유일한 주장은 그것이 중간에 대한 테스트의 필요성으로 여기에 도착했다는 것입니다. 그래서 처음에는 이항 테스트가 아니 었습니다. 내 대답이 가치가 있다고 주장하는 유일한 주장은 독서는 모든 단계를 설명하려는 노력에 있습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.