정규 분포를 가정하여 표준 편차를 사용합니까?


10

표준 편차가 항상 정규 분포를 가정하여 구축되었는지 궁금합니다. 즉, 표본이 정규 분포를 따르지 않으면 표준 편차를 사용하는 것이 실수로 간주되어야합니까?


3
균일 분포의 표준 편차가 있는데 어떻게 이것이 "실수"일 수 있습니까?

답변:


18

표준 편차의 사용은 정규성을 가정하지 않습니다.

랜덤 변수의 분산은 다음과 같이 정의됩니다 Var(X)=E[(XE[X])2]. 분산이 존재하는 한 표준 편차도 존재합니다. 표준 편차는 분산의 제곱근입니다.

분산을 사용할 수 있습니다 바르(엑스)또는 둘이 존재할 때마다 표준 편차. 수많은 상황에서 차이가 발생합니다.

특별한 이론, 렘마 등이 있지만 특별한 경우에는 엑스 정규 분포를 따릅니다.

정규성에 의존하는 표준 편차의 일반적인 사용 :

만약 엑스 정규 분포를 따른다면 약 95 %의 확률로 엑스 평균의 두 표준 편차 내에 속합니다.

그 진술은 사실이라면 엑스 정규 분포 (및 다른 여러 배포)를 따르지만 일반적으로 사실은 아닙니다.

정규성에 의존 하지 않는 분산의 일반적인 사용 :

허락하다 엑스 평균을 갖는 랜덤 변수이다 이자형[엑스]=μ 그리고 분산 바르(엑스)=σ2. 밝히다엑스나는 ...에 대한 나는=1,, 독립적 인 랜덤 변수로서, 각각 동일한 분포를 따르는 엑스.

다음을 기준으로 표본 평균을 정의하십시오. 다음과 같은 관찰 :

엑스¯=1나는=1엑스나는

중앙 한계 정리에 의해 엑스¯ 평균을 갖는 정규 분포 랜덤 변수로 수렴 μ 그리고 분산 σ2. (더 정확하게(엑스¯μ) 배포에 수렴 (0,σ2) 같이 .)

실제 의미는 표본 평균이 엑스¯ 분산이 정규 분포 된 랜덤 변수로 취급 될 수 있습니다. σ2 분산의 함수입니다 엑스. (회상바르(엑스)=σ2.) 그리고이 결과는 그것을 요구하지 않습니다 엑스정상입니다. (더 낮을 필요가 있습니다 만약에 잘 작동 엑스 어떤 의미에서 정규 분포에 더 가깝습니다.)

중앙 한계 정리는 다음의 분산을 사용하는 유비쿼터스 도구입니다. 엑스 그리고 필요하지 않습니다 엑스 정규 분포를 따릅니다.


4
체비 쇼프의 불평등은 분산에만 국한된 것이 아닙니다. 1. 그러므로 나는 SD가 중요하고 (거의) 보편적 인 이유, 예를 들어 중앙 한계 정리의 분산에 의해 수행 되는 독특한 역할을 다른 곳에서 찾아 볼 것을 제안 합니다.
whuber

@ whuber 네, CLT 예제를 작성하기 시작했습니다 (이제 추가했습니다). CLT는 차이를 관리해야하는 매우 실용적인 이유입니다.
Matthew Gunn

1
+1. 그러나 참고 분산은 (함께 평균이) 비정상 배포를위한 일반적인 경우에 대한 자세한 설명이 힘이 더 이상 경우, 그리고 데이터의 다른 d3scriptors 훨씬 더 좋을 수도 제공하는 동안
할보 르센 kjetil B

2

표준 IID 설정에서 적절한 규칙 성 조건에서 에스2 (만큼 잘 σ^미디엄2)는 매우 일관된 추정량입니다. V아르 자형[엑스나는]. 이것은 큰 숫자의 강력한 법칙에서 직접 따릅니다. 일반적인 모델 가정은 필요하지 않습니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.