평균 0 및 표준 편차 1 분포가 항상 사용되는 이유는 무엇입니까?


15

내 통계는 자체적으로 가르쳐졌지만 읽은 많은 자료는 평균 0과 표준 편차가 1 인 데이터 세트를 가리 킵니다.

이 경우 다음과 같습니다.

  1. 평균 0과 SD 1이 좋은 특성 인 이유는 무엇입니까?

  2. 이 표본에서 추출한 임의 변수가 0.5 인 이유는 무엇입니까? 0.001을 그릴 확률은 0.5와 동일하므로 평평한 분포 여야합니다.

  3. 사람들이 Z 점수에 대해 이야기 할 때 실제로 여기서 의미하는 것은 무엇입니까?

답변:


11
  1. 처음에 가장 유용한 대답은 아마도 평균 0과 sd 1이 수학적으로 편리하다는 것입니다. 평균이 0이고 표준 편차가 1 인 분포에 대한 확률을 계산할 수 있으면 매우 간단한 방정식으로 유사한 점수 분포에 대해이를 해결할 수 있습니다.

  2. 나는이 질문을 따르지 않습니다. 평균 0과 표준 편차 1은 일반적으로 종 곡선이라고하는 표준 정규 분포에 적용됩니다. 가장 가능성이 높은 값은 평균이며, 멀수록 멀어집니다. 정말로 평평한 분포를 가지고 있다면 다른 것보다 더 가치가 없습니다. 귀하의 질문은 잘못 구성되었습니다. 코인 플립에 대한 질문을보고 계셨습니까? 이항 분포와 중심 제한 정리를 찾아보십시오.

  3. "여기서"? 어디? z- 점수에 대한 간단한 대답은 점수가 평균이 0이고 표준 편차가 1 인 것처럼 점수가 매겨진다는 것입니다. 그것에 대해 생각하는 또 다른 방법은 점수가 표준 편차의 수에 따라 개별 점수를 얻는다는 것입니다. 평균. 방정식은 (점수-평균) / 표준 편차를 계산합니다. 당신이 해야하는 이유는 매우 다양하지만 하나는 인트로 통계 과정에 다른 z 점수에 대한 확률 표가 있기 때문입니다 (답 1 참조).

wikipedia에서도 z- 점수를 먼저 살펴보면 꽤 좋은 답변을 얻었을 것입니다.


2) X가 연속 랜덤 변수 일 때 혼란은 p (X = .01)의 의미라고 생각합니다. 직관적으로, X가 정확히 .01 일 가능성이 없기 때문에 확률은 모든 곳에서 0 인 것처럼 보입니다. 질문자는 연속적인 경우 밀도 함수의 정의를 검토해야하며, 이는 누적 밀도 함수의 미분으로 정의됩니다.
Tristan

7

여기서 말하는 것은 표준 정규 분포, 평균이 0이고 표준 편차가 1 인 정규 분포입니다. 표준 정규 분포로 분포 된 변수의 속기는 Z입니다.

다음은 귀하의 질문에 대한 답변입니다.

(1) 표준 정규 분포가 매력적인 두 가지 주요 이유가 있다고 생각합니다. 먼저, 정규 분포로 분산 된 변수는 각 관측치를 표준 편차로 나누기 전에 각 관측치에서 평균을 빼서 표준 법선으로 변환하거나 변환 할 수 있습니다. 이것을 Z 변환 또는 Z 점수 생성이라고합니다. 이것은 특히 컴퓨터 이전의 날에 매우 편리합니다.

(엑스나는엑스¯)σ엑스=(7565.6)10.2=0.9215

표준 정규 분포가 자주 사용되는 두 번째 이유는 해석으로 인해 Z- 점수를 제공하기 때문입니다. Z 변환 변수의 각 "관측"은 원래 변환되지 않은 관측치가 평균과 몇 개의 표준 편차가되었는지입니다. 이는 원시 또는 절대 성능이 상대 성능보다 중요하지 않은 표준화 된 테스트에 특히 유용합니다.

(2) 나는 당신을 따르지 않습니다. 누적 분포 함수의 의미에 대해 혼란 스러울 수 있습니다. 표준 정규 분포의 기대 값은 0이며이 값은 연관된 누적 분포 함수의 0.5 값에 해당합니다.

(엑스나는엑스¯)σ엑스=(7565.6)10.2=0.9215

1

Graham과 John으로부터 훌륭한 설명을 받았으므로 마지막 질문에 대답하겠습니다.

사람들이 Z 점수에 대해 이야기 할 때 실제로 여기서 의미하는 것은 무엇입니까?

μσ

따라서 : (65-80) / 5 = -3

65 학년의 z 점수는 -3 이라고 말할 수 있습니다 . 즉, 왼쪽에 3 표준 편차가 있습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.