표본 크기, 표본 평균 및 모집단 평균만으로 스튜던트 t- 검정을 수행하는 방법은 알려져 있습니까?


28

스튜던트 에는 표본 표준 편차 가 필요합니다 . 그러나 표본 크기와 표본 평균 만 알려진 경우 어떻게 계산 합니까?tss

예를 들어, 표본 크기가 이고 표본 평균이 이면 각각 값을 가진 개의 동일한 표본 목록을 만들려고합니다 . 샘플 표준 편차는 입니다. 테스트 에서 0으로 나누기 문제가 발생합니다 .49112491120t

추가 자료 :
ACME North Factory 근로자의 평균 소득은 $$ 입니다. ACME South Factory에서 근로자 가 무작위로 수입이 . 이 차이가 통계적으로 유의합니까?$20049$112

모집단 평균이 이라고 말하는 것이 맞 습니까?$200


어떤 문제를 해결하려고합니까? 더 많은 정보를 알려 주면 도움이 될 것입니다.
pmgjones

확실한. 샘플 문제를 추가했습니다.
키트 :

답변:


32

이것은 많은 사람들을 놀라게 할 수 있지만,이 문제를 해결하기 위해 반드시 s 를 추정 할 필요는 없습니다 . 사실, 당신은 알 필요가 없습니다 아무것도 (즉 물론, 도움이 될 것입니다 있지만) 데이터의 확산에 대한합니다. 예를 들어 2001 년 기사의 Wall, Boen 및 Tweedie는 단일 추첨을 기반으로 한 단봉 분포의 평균에 대한 유한 신뢰 구간을 찾는 방법을 설명합니다 .

이 경우, 표본 평균 112를 대략 정규 분포 (즉, 49 개의 단순 랜덤 표본 평균의 표본 분포)에서 도출 한 것으로 간주 할 근거가 있습니다. 우리는 암시 적으로 상당히 많은 수의 공장 노동자가 있고 그들의 급여 분배가 중심 한계 정리를 작동시킬 수 없을 정도로 비뚤어 지거나 여러 모달이 아니라고 가정합니다. 그런 다음 평균에 대한 보수적 인 90 % CI가

112+5.84 |112|,

분명 200의 진정한 평균 (참조 벽 커버 우리가 따라서 (200)에서 "상당히"그 (112) 다릅니다 결론을 내릴 수없는, 제한된 정보를 사용할 수의 수학 식 3)과 가정은 여기에서.

참조 : "크기 1과 2의 표본을 가진 평균에 대한 유효 신뢰 구간" 미국 통계 학자, 2001 년 5 월, Vol. 55, 2 번 : pp. 102-105. ( pdf )


4
네! 이것이 바로 공부할 가치가있는 이유입니다. 직관에 대한 도전은 매우 교육적입니다. 먼저 Carlos Rodriguez (SUNY Albany) 웹 페이지에있는 명확한 논문에서이 사실을 알게되었지만 오늘 아침에 서버를 찾을 수없는 것으로 나타났습니다. 나중에 인터넷 검색 "carlos rogriguez 통계"를 사용해보십시오. (그의 논문은 omega.albany.edu/8008/confint.html 에 있지만,이 URL은 오래된 URL 일 수 있습니다.)
whuber

4
놀랄 만한. 나는 몰랐다. 참조 주셔서 감사합니다.
Rob Hyndman

4
고맙습니다-이것이 당신이 생각하고있는 로드리게즈 종이 일 가능성이 있습니까? arxiv.org/abs/bayes-an/9504001
ars

2
대단하다. 그러나 Wall 등이 "필요한 것보다 더 넓은"것으로 설명하는 공식 (3) (Edelman에서 제공)을 적용한 이유가 궁금합니다. (3)을 언급하기 직전 단락의 끝을 향해서 그들은 90 % 간격으로 4.84 (정확히는 5.84보다 작은 1)를 사용합니다. 의심 할 여지없이 나는 무언가를 놓쳤다.
Glen_b-복지 주 모니카

2
@Glen_b 반대로, 나는 뭔가를 놓친 것 같습니다. 다음에이 논문이 필요할 때주의를 기울일 것이지만 그 동안 상수의 차이는 여기서 분석에 영향을 미치지 않습니다.
whuber

13

이것은 약간 고안된 질문으로 보입니다. 49는 7의 정확한 제곱입니다. p <0.05의 양측 검정에 대한 48 DoF의 t- 분포 값은 거의 2 (2.01)입니다.

| sample_mean-popn_mean |의 경우 평균 동등성의 귀무 가설을 기각합니다. > 2 * StdError, 즉 200-112> 2 * SE이므로 SE <44, 즉 SD <7 * 44 = 308입니다.

마이너스 임금없이 표준 편차가 308 (또는 그 이상) 인 평균 112의 정규 분포를 얻는 것은 불가능합니다.

임금이 아래로 제한되어 있기 때문에, 로그 정규 분포가 더 적절하다고 가정 할 때 비뚤어 질 가능성이 있지만 t- 검정에서 p <0.05를 피하기 위해서는 여전히 매우 가변적 인 임금이 필요합니다.


3

μ=0.999112+0.00188112=200.49/1000<0.05실제로 직원 / CEO 비율과 CEO 급여를 조정하여 49 명의 직원으로 구성된 CEO가 CEO를 뽑아 낼 수는 없지만, 인구 평균은 200 명으로 고정 할 수 있습니다. 샘플 평균 따라서 112에서하지 않고 몇 가지 기본 분포에 대한 가정을, 당신은 인구 평균에 대한 추론을 그릴 수 없습니다.


2
$

1
(1) 잘 잡는다. (2), 그래, 난 고정 된 결과에 대한 점근 적으로 왜곡 된 문제 설정을 할 수 있습니다 사후 . 내 잘못이야. 그러나 더 이상 OP가 테스트하려고하는 것이 확실하지 않습니다. 모집단 평균이 200이라는 것을 알고 있다면 왜 테스트를 시도합니까?
shabbychef

1
BTW, 아마도 미국의 CEO 급여 / 최소 급여 급여 400의 비율은 극단적 인 것으로 간주되지 않습니다. 800은 조금 이상하다.
shabbychef

2

나는 당신이 하나의 샘플 t 테스트를 참조한다고 가정합니다. 그 목표는 표본의 평균을 가상의 평균과 비교하는 것입니다. 그런 다음이 질문에 답하는 P 값을 계산 (집단이 가우시안이라고 가정)합니다. 모집단 평균이 실제로 가정적인 값인 경우 평균이 해당 값에서 (또는 그 이상) 거리에있는 표본을 추출 할 가능성은 거의 없습니다. 당신은 관찰? 물론 그 질문에 대한 답은 표본 크기에 따라 다릅니다. 그러나 그것은 또한 가변성에 달려 있습니다. 데이터에 대량의 산포가있는 경우 광범위한 모집단 평균과 일치합니다. 데이터가 실제로 타이트한 경우 더 작은 범위의 모집단 평균과 일치합니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.