비정규 분포에서 표준 편차가 무엇을 알려줍니까?


40

정규 분포에서 68-95-99.7 규칙은 표준 편차에 많은 의미를 부여하지만 비정규 분포 (다중 또는 비대칭)에서 표준 편차는 무엇을 의미합니까? 모든 데이터 값이 여전히 3 표준 편차 내에 있습니까? 비정규 분포에 대한 68-95-99.7 규칙과 같은 규칙이 있습니까?


16

트윗 담아 가기 이것은 내 질문에 완벽하게 대답합니다.
Zuhaib Ali

3
@COOLSerdash의 요점은 여기에 목표이지만 Chebyshev의 불평등에 대한 표준 진술은 샘플에서 추정 된 SD가 아니라 실제 SD 알려진 a-priori와 관련이 있습니다. 이 우수한 CV 스레드를 읽는 데 도움이 될 수 있습니다. 일방적 인 Chebeshev 부등식의 샘플 버전이 있습니까?
gung-Monica Monica 복원

또한 체비 쇼프에 대해 즉시 해결해서는 안됩니다.
Steve S

1
@gung은 68-95-99.7 규칙도 마찬가지입니다!
Glen_b

답변:


12

표준 편차는 변동의 특정 측정치입니다. 몇 가지 다른 것들이 있으며, 평균 절대 편차는 상당히 유명합니다. 표준 편차는 결코 특별하지 않습니다. 그것이 특별하게 보이는 것은 가우시안 분포가 특별하다는 것입니다.

의견에서 지적했듯이 Chebyshev의 불평등은 느낌을 얻는 데 유용합니다. 그러나 있습니다.


9

두 번째 중심 모멘트의 제곱근 인 분산입니다. 모멘트는 확률 분포를 정의하는 이유로 특성이라고하는 특성 함수 (CF) 와 관련됩니다 . 따라서 모든 모멘트를 알고 있다면 CF를 알 수 있으므로 전체 확률 분포를 알 수 있습니다.

정규 분포의 특성 함수는 평균과 분산 (또는 표준 편차)의 두 모멘트로 정의됩니다. 따라서 정규 분포의 경우 표준 편차가 특히 중요합니다. 이는 표준 정의의 50 %입니다.

다른 분포의 경우 표준 편차는 다른 모멘트를 가지 므로 덜 중요 합니다. 그러나 실제로 사용되는 많은 분포의 경우 처음 몇 순간이 가장 크므로 알아야 할 가장 중요한 순간입니다.

이제 직관적으로 평균은 분포 의 중심 이 어디에 있는지 , 표준 편차는이 중심에 얼마나 가까운 지 알려줍니다.

표준 편차는 변수의 단위이므로 kurtosis 와 같은 측정 값을 얻기 위해 다른 모멘트를 스케일링하는 데에도 사용됩니다 . 첨도는 지방이 정규 분포와 비교하여 분포의 꼬리가 얼마나되는지 알려주는 무 차원 측정법입니다.


1
"이제 직관적으로 평균은 분포의 중심이 어디인지, 표준 편차는이 중심에 얼마나 가까운 지 알려줍니다." -분포가 정규 인 경우에만 적용되지 않습니까? 그렇지 않은 경우 중앙값이 중앙 경향의 더 나은 척도입니다.
Dan Temkin 2019

@DanTemkin 중앙값을 사용하면 표준 편차의 값이 어느 정도 손실됩니다. 평균에서 계산됩니다. 중앙값을 사용하면 왜곡에 대해 이야기하는 것이 합리적입니다. OP는 비뚤어진 분포에 초점을 맞추지 않았습니다. 따라서 대칭 분포에 대해 평균 = 중간 값을 가지면 상단이 정상이 아닙니다. 따라서 표준 편차가 논의 될 때 평균에 대해 이야기하는 것이 합리적입니다.
Aksakal

4

표본 표준 편차는 데이터를 측정하기 위해 동일한 단위로 평균에서 관측 된 값의 편차를 측정 한 것입니다. 정규 분포 또는 아닙니다.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.