모집단 평균에서 훨씬 더 멀리있는 값에 대한 통계 테스트 : Z- 테스트입니까, T- 테스트입니까?


12

값 목록과 비교하여 값이 얼마나 중요합니까? 대부분의 경우 통계 테스트에는 표본 세트를 모집단과 비교하는 것이 포함됩니다. 필자의 경우 샘플은 하나의 값으로 만들어지며 인구와 비교됩니다.

나는 아마도 가장 기본적인 문제에 직면 한 통계적 가설 테스트에있어 중요한 문제입니다. 그것은 단지 하나의 시험이 아니라 수백 가지의 시험입니다. 매개 변수 공간이 있으며 모든 점에 대해 유의성 테스트를 수행해야합니다. 각 매개 변수 조합에 대해 값 및 백그라운드 목록 (인구)이 생성됩니다. 그런 다음 p- 값으로 주문하고 흥미로운 매개 변수 조합을 찾으십시오. 실제로,이 p-val이 높은 (무의미한) 모수 조합을 찾는 것도 중요합니다.

하나의 테스트를하겠습니다. 선택한 세트에서 계산 된 값과 임의의 트레이닝 세트를 선택하여 계산 된 배경 값이 있습니다. 계산 된 값은 0.35이며 백그라운드 세트는 평균 0.25와 매우 좁은 표준 (e-7)으로 정규 분포 (아마도?)입니다. 실제로 분포에 대한 지식이 없습니다. 샘플은 다른 것으로 계산되기 때문에 일부 분포의 임의의 숫자 샘플이 아니므로 배경이 올바른 단어입니다.

귀무 가설은 "샘플 테스트의 평균이 계산 된 값 0.35와 같다"는 것입니다. 언제 Z- 테스트 또는 T- 테스트로 간주해야합니까? 값이 모집단 평균보다 훨씬 높기를 원하므로 단일 꼬리 검정입니다.

샘플로 무엇을 고려 해야할지에 대해 약간 혼란 스럽습니다. 샘플로 하나의 샘플 (관측)과 백그라운드 목록이 있거나 샘플이 백그라운드 목록이며 전체 샘플과 비교하고 있습니다 (샘플링되지 않은) 귀무 가설에 따라 동일한 평균을 가져야하는 모집단. 이것이 결정되면 테스트는 다른 방향으로 진행됩니다.

T- 검정 인 경우 p- 값을 어떻게 계산합니까? R / Python / Excel 함수를 사용하는 대신 직접 계산하고 싶습니다 (이미 방법을 알고 있습니다). 그래서 올바른 수식을 먼저 설정해야합니다.

우선 T- 테스트가 너무 일반적이라고 생각합니다. 제 경우에는 T- 테스트가 샘플 크기에 연결되고 형식은 여기서 이며 s는 이며 표본 표준 대 모집단 표준입니다. 따라서 두 가지 경우가 있습니다. 표본 크기는 모집단의 크기입니다. "추측"은 Z- 검정을 다루고 있음을 의미하거나 모집단 통계 (n 및 std)는 알 수 없지만 분포는 근사한 방법으로 T 테스트를 처리하고 있습니다. 어쨌든 다음 질문은 다음과 같습니다.Z = ˉ X

T=Z/s,
Z=X¯σn
s=σ^/σ
  1. p- 값은 어떻게 계산합니까? (즉, R / Python / Excel 함수 또는 p- 값 테이블 조회를 사용하지 않고 실제로 내가하는 일을 알고 있기 때문에 공식을 기반으로 계산합니다)
  2. 표본 크기에 따라 유의성 임계 값을 어떻게 결정합니까? (수식이 좋을 것입니다)

3
왜 테스트해야합니까? 체비 쇼프의 불평등은 실제 모집단에서 가장 큰 값 이 평균보다 SDs 인 것이 수학적으로 불가능하다는 것을 암시 하지만 그것이 관찰 한 것입니다 ( ). 따라서 는 모집단에서 나오지 않았습니다. 1060.35=106×107+0.250.35
whuber

1
@grokkaine-이 질문은 흥미로운 문제를 제기하고 가치가있는 것처럼 보이지만 조금 편집하면 용어에 매우 정확하게주의를 기울여 더 가치가 있음을 알았습니다.
rolando2

그것은 단지 하나의 시험이 아니라 수백 가지의 시험입니다. 매개 변수 공간이 있으며 모든 점에 대해 유의성 테스트를 수행해야합니다. 각 매개 변수 조합에 대해 값 및 백그라운드 목록 (인구)이 생성됩니다. 그런 다음 p- 값으로 주문하고 흥미로운 매개 변수 조합을 찾으십시오. 실제로,이 p-val이 높은 (무의미한) 모수 조합을 찾는 것도 중요합니다. 잠시 후 게시물을 수정하려고합니다.
grokkaine

답변:


10

당신은 흥미로운 질문을 제기합니다. 우선, 관측치 0.35, 평균 0.25, 표준 편차 1 / 10 ^ 7 (e ^ -7 비트를 해석하는 방법)이 있다면 가설을 세울 필요가 없습니다. 테스트 운동. 0.35 관측 값은 평균에서 수천 표준 편차가 떨어져 평균으로부터 수백만 표준 오차가있을 것이라는 점에서 0.25의 평균과 매우 다릅니다.

Z- 검정과 t- 검정의 차이는 주로 표본 크기와 관련이 있습니다. 120보다 작은 샘플의 경우 t- 검정을 사용하여 p 값을 계산해야합니다. 샘플 크기가 이보다 클 경우 사용하는 샘플 크기가 큰 경우 큰 차이가 없습니다. 샘플 크기에 관계없이 두 가지 방법으로 계산하고 두 테스트 사이의 차이가 얼마나 작은지를 관찰하는 것은 재미 있습니다.

사물을 직접 계산하는 한 관측치와 평균의 차이를 나누고 표준 오차로 나눠서 통계를 계산할 수 있습니다. 표준 오차는 표준 편차를 표본 크기의 제곱근으로 나눈 값입니다. 자, 당신은 당신의 t 통계가 있습니다. p 값을 계산하기 위해 테스트 테이블에서 t 값을 찾는 것 외에 다른 대안은 없다고 생각합니다. 간단한 Excel 대안 TDIST (t 통계 값, DF, 1 또는 2 꼬리 p 값의 경우 1 또는 2)를 수락하면 트릭을 수행합니다. Z를 사용하여 p 값을 계산하기 위해 1 테일 테스트의 Excel 공식은 다음과 같습니다.

경고와 마찬가지로, 가설 검정 방법은 표본 크기에 따라 왜곡 될 수 있습니다. 즉, 표본 크기가 클수록 표준 오차가 작을수록 결과 Z 값 또는 t 통계가 높아지고 p 값이 낮아지고 통계적 유의성이 높아집니다. 이 논리를 바로 잡기 위해 표본 크기가 크면 통계적 유의성이 높아집니다. 그러나 큰 표본 크기와 관련하여 높은 통계적 유의성은 완전히 중요하지 않을 수 있습니다. 다시 말해, 통계적으로 유의미한 것은 수학적 문구입니다. 반드시 웹스터 사전에 따라 의미가있는 것은 아닙니다.

이 큰 표본 크기 트랩에서 벗어나기 위해 통계학자는 효과 크기 방법으로 이동했습니다. 후자는 표준 오차 대신 표준 편차와 두 관측치 사이의 통계적 거리 단위로 사용됩니다. 이러한 프레임 워크를 사용하면 표본 크기가 통계적 유의성에 영향을 미치지 않습니다. 효과 크기를 사용하면 p 값에서 멀어지고 영어로 더 의미있는 신뢰 구간으로 이동하는 경향이 있습니다.


답장을 보내 주셔서 감사합니다. 샘플로 무엇을 고려 해야할지 조금 혼란 스럽습니다. 인구로 하나의 샘플 (관측)과 배경 목록을 가지고 있거나 샘플이 배경 목록이고 비교합니다. 귀무 가설에 따라 동일한 평균을 가져야하는 전체 (샘플링되지 않은) 모집단. 이것이 결정되면 테스트는 다른 방향으로 진행됩니다.
grokkaine

표본으로 가지고있는 모든 관측치를 사용하십시오 (소위 무엇이든). 그리고 하나의 관측치와 정의 된 샘플의 평균 사이의 통계적 거리를 계산합니다. 표본의 표준 편차와 표준 오차를 계산하십시오. 그리고 평균에서 관측치의 통계 거리는 (관찰-평균) / 표준 오차 = t 통계입니다. Excel TDIST 함수 (DF, t stat, 1 (한 꼬리))를 사용하면 p 값을 얻습니다.
Sympa

5

가설 검정은 항상 모집단을 나타냅니다. 샘플에 대해 진술하고 싶다면 테스트 할 필요가 없습니다 (보는 내용을 비교하십시오). 빈번한 전문가는 무증상을 믿으며, 표본 크기가 크면 데이터 분포에 대해 걱정하지 마십시오. Z- 검정과 T- 검정은 검정 통계량 계산 측면에서 기본적으로 동일하지만 임계 값 만 다른 분포 (일반 대 학생 -T)에서 얻습니다. 표본 크기가 크면 차이가 거의 없습니다.

Q1에 관하여 : n-1 자유도를 가진 T- 분포에서 찾아보십시오. 여기서 n은 표본 크기입니다.

Q2 관련 : Z- 검정의 원하는 유의 수준 및 T- 검정의 경우 표본 크기의 유의 수준을 기준으로 임계 값을 계산합니다.

그러나 진지하게 몇 가지 기본 사항을 검토해야합니다.


답변 해주셔서 감사합니다. 사실 제가 사용하고있는 t-dist이지만, "왜"를 사용하고 있는지 이해하고 싶었습니다. "큰"샘플을 어떻게 정의하고 p- 값이 어떻게 다른가? 더 중요한 것은 분포가 정규인지 또는 학생인지를 어떻게 알 수 있습니까? 이에 대한 통계 테스트가 있습니까? 어쩌면 kolmogorov-smirnov 테스트를 두 번째로 사용하고 흠 .. 첫 번째로 무엇을 사용해야합니까?
grokkaine

2
큰 ... well Z와 t는 n = 60으로 시작합니다. 두 테스트에서 얻은 p- 값을 비교하십시오. t / 정규 분포 가정은 기본 데이터의 분포에 의존하지 않습니다. 평균의 샘플링 분포가 정상이라고 가정합니다. 테스트중인 변수가 감마 분포되어 있어도 여전히 유지됩니다. n = 200 정도이면 정상적으로 작동합니다. 다시 말하지만,이 모든 것들은 빈번한 통계를 기반으로합니다.
joint_p

인구로 다스 려하지만 -1 질문자가 1의 샘플을 가지고 있다는 점 놓치고 보이는 항상 테스트 가설에 코멘트 +1
피터 엘리스

1
나는 "나는 계산 된 값과 무작위로 생성 된 값의 배경 세트를 가지고있다. 계산 된 값은 0.35"라는 것이 무엇인지를 확신하지 못했다.
joint_p

다른 단락에서 내 의견을 다시 게시 : 샘플로 무엇을 고려 해야할지에 대해 약간 혼란 스럽습니다. 인구로 샘플 하나 (관측)와 배경 목록이 있거나 샘플이 배경 목록입니다. 나는 귀무 가설에 따라 동일한 평균을 가져야하는 전체 (샘플링되지 않은) 인구와 비교하고 있습니다. 이것이 결정되면 테스트는 다른 방향으로 진행됩니다.
grokkaine
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.