Z- 점수와 p- 값의 차이점은 무엇입니까?


11

네트워크 모티프 알고리즘에서 통계에 대해 p- 값Z- 점수 를 모두 반환하는 것이 일반적입니다 . "입력 네트워크에 하위 그래프 G의 X 복사본이 포함되어 있습니다." 서브 그래프는 만족할 경우 주제로 간주

  • p- 값 <A,
  • Z- 점수> B 및
  • X> C, 일부 사용자 정의 (또는 커뮤니티 정의) A, B 및 C

이것은 질문에 동기를 부여합니다.

질문 : p- 값과 Z- 점수의 차이점은 무엇입니까?

그리고 하위 질문 :

질문 : 동일한 통계량의 p- 값과 Z- 점수가 반대 가설을 제안 할 수있는 상황이 있습니까? 위에 나열된 첫 번째 조건과 두 번째 조건이 본질적으로 동일합니까?

답변:


9

귀하의 질문에 따라 세 가지 시험 사이에 차이가 없다고 말하고 싶습니다. 이것은 어떤 기준을 사용하든 동일한 결정이 내려 지도록 항상 A, B 및 C를 선택할 수 있다는 의미입니다. p- 값이 동일한 통계 (예 : Z- 점수)를 기반으로해야하지만

Z- 점수를 사용하기 위해 평균 및 분산 는 모두 알려진 것으로 가정되며 분포는 정규 (또는 무정형 / 대략 정규)로 가정됩니다. p- 값 기준이 보통 5 %라고 가정합니다. 그리고 우리는 :μσ2

p=Pr(Z>z)<0.05Z>1.645Xμσ>1.645X>μ+1.645σ

따라서 모두 같은 컷오프를 나타내는 트리플 이 있습니다.(0.05,1.645,μ+1.645σ)

숫자가 다를지라도, t- 테스트에도 동일한 대응이 적용됩니다. 양측 테일 테스트도 비슷한 서신을 가지지 만 숫자는 다릅니다.


고마워요! (그리고 다른 답변자에게도 감사드립니다).
Douglas S. Stones

8

-score는 표준 편차 단위로 평균에서 편차를 설명합니다. 귀무 가설을 수락할지 거부할지에 대해서는 명확하지 않습니다.Z

- 값은 귀무 가설 하에서 우리는 당신의 통계로 극단적으로되는 점을 관찰 할 수 있다는 가능성이다. 테스트 크기 주어지면 귀무 가설을 기각할지 또는 수락하는지 명시 적으로 알려줍니다 .pα

예를 고려 여기서 및 귀무 가설은 . 그런 다음 를 관찰하십시오 . 귀하 -score은 5입니다 (단지 당신의 측면에서 귀무 가설에서 벗어나 얼마나 당신을 알려줍니다 )와 - 값이 5.733e-7이다. 95 % 신뢰도를 위해서는 검정 크기 되고 이후 귀무 가설을 기각합니다. 그러나 주어진 통계량에 대해 검정이 동일하도록 동등한 와 가 있어야합니다 .XN(μ,1)μ=0x1=5Zσpα=0.05p<αAB


3
@Gary-p- 값은 Z- 점수 이상을 거부하거나 거부하지 않습니다. 그들은 단지 숫자입니다. 수락 또는 거부를 결정하는 것은 결정 규칙 일뿐입니다. 이 결정 규칙은 똑같이 잘 Z 점수의 관점에서 정의 될 수있다 (예를 들면 또는 규칙)2σ3σ
probabilityislogic

@probabilityislogic 동의합니다. 실제로 점수 임계 값을 기반으로 일부 테스트를 구성 할 수 는 있지만 고전적인 의미로 (즉, 확률 측면에서) 테스트 크기를 명시 적으로 정의 할 수는 없습니다. 분포에 두꺼운 꼬리가있는 경우 이러한 종류의 기준이 문제가 될 수 있습니다. 테스트를 구성 할 때 테스트 크기를 명시 적으로 정의하므로 값은 즉시 승인 또는 거부 여부를 알려줍니다. Zp
Gary

@gary-실제로 p- 값이 대안을 언급하지는 않습니다. 따라서 대안을 직접 비교하는 데 사용할 수 없습니다. 예를 들어, 대 . 의 p- 값은 과 동일하게 유지됩니다 . 따라서 "null을 거부합니다"라고 말하면 "대안을 수락 함"을 의미하고 선언하십시오 . 그러나 이것은 터무니없고 아무도 이것을하지 않을 것이지만 여기서 사용하는 p- 값 규칙은이를 수행합니다. 다른 방법, 당신을 설명하는 p- 값 규칙 (해상도 예정)은 "귀무 가설"이라고 무엇에 대한 불변하지 않습니다H0:μ=0HA:μ=1H05×107μ=1
probabilityislogic

명백한 부조리의 해결은 p- 값이 "절대"검정이 아니라 내재 대립 가설로 정의 된 상대 검정이라는 점에 유의하십시오. 이 경우 암시적인 대안은 입니다. 당신은 내가의 p- 값을 계산하는 경우 있음을 주목하여 볼 수 있습니다 내가 얻을 에 대한 p- 값보다 작은, 인 . 이제이 예에서 "암시 적 대안"은 직관을 통해 쉽게 찾을 수 있지만 성가신 매개 변수가 없거나 통계가 충분하지 않은보다 복잡한 문제에서는 찾기가 훨씬 어렵습니다. Himp:μ=5HA1×109H0
chanceislogic

1
@Gary-p- 값은 확률이기 때문에 더 이상 엄격하지 않습니다. Z- 점수의 단조로운 일대일 변환입니다. p- 값이 소유 한 "엄격한"것도 Z- 점수가 소유합니다. 양면 테스트를 사용하는 경우 Z- 점수가 절대 값에 해당합니다. 그리고 을 null과 비교하려면 "minimax"접근 방식을 사용해야합니다. 이는 데이터에서 가장 많이 지원되고 과 일치하는 예리한 가설을 선택하는 것 입니다. 를 계산하는 방법을 보여줄 수 없다면H1:μ0H1P(X|μ1)
확률 론적

6

p 값은 통계가 거의 없을 가능성을 나타냅니다. 점수는 평균에서 얼마나 멀리 떨어져 있는지 나타냅니다. 샘플 크기에 따라 차이가있을 수 있습니다.z

큰 표본의 경우 평균에서 약간의 편차 만 발생하지 않습니다. 즉, 낮은 점수에서도 값이 매우 작을 수 있습니다 . 반대로, 작은 샘플의 경우 큰 편차도 거의 없습니다. 즉, 큰 점수는 반드시 작은 값을 의미하지는 않습니다 .pzzp


표본 크기가 크면 표준 편차가 작으므로 Z- 점수가 높아집니다. 숫자 예제를 시도하면 이것을 발견 할 수 있다고 생각합니다.
확률 확률

1
실제로는 아닙니다. N (0, 1)에서 샘플링한다고 가정합니다. 그런 다음 표준 크기는 샘플 크기에 관계없이 약 1입니다. 더 작아지는 것은 표준 편차가 아닌 평균의 표준 오차입니다. p- 값은 표준이 아닌 SEM을 기반으로합니다.
SheldonCooper

Z- 점수는 (관측 평균) / (표준 편차)입니다. 그러나 평균 및 표준 편차는 구성 요소를 추출한 모집단이 아니라 관찰 된 통계량입니다. 내 느슨한 용어가 여기에 포착되었습니다. 그러나 평균을 테스트하는 경우 Z- 점수에서 적절한 표준 편차가 표준 오류이며 p- 값과 동일한 속도로 작아집니다.
probabilityislogic
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.