표준 편차의 표준 편차


54

데이터의 정규성을 가정 할 수있는 경우 표준 편차의 표준 편차 추정치는 무엇입니까?


표본 분산분포를 찾고 있다고 가정합니다 . 이 내용은 Wikipedia 페이지의 2016 년 8 월 21 일 16:55에 대한 차이에 대한 섹션으로 연결됩니다.이 문서는 Wikipedia에 대한 링크이므로 향후 기사가 변경 될 수 있습니다. 따라서이 섹션은 이러한 변경 후이 답변이 참조하는 내용을 반영하지 않을 수 있습니다. 따라서 Wikipedia 페이지의 이전 버전에 대한 링크가 여기에 제공됩니다. 현재 분산에 관한 기사는 [here] ( en.wikipedia.org/wik

답변:


58

하자 . 이 스레드에 표시된대로 샘플 표준 편차의 표준 편차X1,...,XnN(μ,σ2)

s=1n1i=1n(XiX¯),

이다

SD(s)=E([E(s)s]2)=σ12n1(Γ(n/2)Γ(n12))2

여기서 는 감마 함수 이며 은 표본 크기이고 는 표본 평균입니다. 는 의 일관된 추정량 이므로 위의 방정식에서 를 로 바꾸어 의 일관된 추정량을 얻습니다 .Γ()nX¯=1ni=1nXisσσsSD(s)

이것이 편견없는 추정량 인 경우이 스레드 에서 은 기대의 선형성에 의해 제안합니다.E(s)=σ2n1Γ(n/2)Γ(n12)

sn12Γ(n12)Γ(n/2)

의 편견없는 추정값으로서 . 이 모든 것이 기대의 선형성과 함께 의 편견 추정량을 제공합니다 . σSD(s)

sΓ(n12)Γ(n/2)n12(Γ(n/2)Γ(n12))2

12
+1 거의 2 년 후에 더 나은 답변이 나올뿐만 아니라이 글타래의 다른 곳보다 더 유용한 정보를 제공하는 답변을 보게되어 기쁩니다.
whuber

2
첫 번째 공식에서 거리를 제곱하는 것을 잊었습니까?
danijar

2
감마 함수는 작은 값이 아닌 을 계산하기가 어렵습니다 . 스털링의 근사를 적용하면 계산 가능하고 약간 이 나타납니다 보다 간결한 표현 방식. nse(11n)n11
equaeghe

1
s (
@Macro

간단한 형태를 원하는 사람들에게는 이 몇 퍼센트 수준의 근사치입니다. s/2(n1)
Syrtis Major

5

평균이 0이고 분산이 법선에서 iid 를 관찰한다고 가정합니다 . (경험) 표준 편차는 평가 기의 제곱근이다 의 (편견 여부를 그 질문하지 않습니다). 추정기 ( 획득 )로서 는 이론적으로 계산할 수있는 분산을 갖습니다. 표준 편차의 표준 편차라고하는 것이 실제로 표준 편차의 분산의 제곱근입니다 (예 : ? 추정값이 아니며 이론적 인 양입니다 (X1,,Xnσ2σ^2σ2X1,,Xnσ^E[(σσ^)2]σ/n 명시 적으로 계산할 수있는)!


추정기의 기능이 여전히 추정기입니까? 나는 여전히 \ sigma를 모르고 X_i 만 알고 있습니다.

그렇다면 분산의 제곱근 추정치의 분산의 제곱근을 추정 할 수 있습니다 ... right :)는 ? σ^/n
로빈

무엇 Srikant 발견 (어떤 PhysicsForums에서 확인 것 같다)이 있어야 , 그래서 오히려 . 2σ^22n

1
Aww, 그 의견은 잠겼다. . 적어도 이것은 부트 스트랩과 일치하는 결과를 제공합니다. σ^2n

-3

@Macro는 계산할 방정식으로 훌륭한 수학적 설명을 제공했습니다. 다음은 수학이 적은 사람들을위한보다 일반적인 설명입니다.

"SD of SD"라는 용어는 많은 사람들에게 혼동을 일으킨다 고 생각합니다. SD의 신뢰 구간에 대해 생각하기가 더 쉽습니다. 표본에서 계산 한 표준 편차는 얼마나 정확합니까? 우연히 모여있는 데이터를 수집하여 샘플 SD를 모집단 SD보다 훨씬 낮게 만들었을 수도 있습니다. 또는 전체 모집단보다 훨씬 더 흩어져있는 값을 임의로 획득하여 표본 SD를 모집단 SD보다 높게 만들 수 있습니다.

SD의 CI를 해석하는 것은 간단합니다. 데이터가 가우시안 분포에서 무작위로 독립적으로 샘플링되었다는 일반적인 가정으로 시작하십시오. 이제이 샘플링을 여러 번 반복하십시오. 이러한 신뢰 구간의 95 %가 실제 모집단 SD를 포함 할 것으로 예상합니다.

SD의 95 % 신뢰 구간은 얼마나 넓습니까? 물론 샘플 크기 (n)에 따라 다릅니다.

n : SD의 95 % CI

2 : 0.45 * SD에서 31.9 * SD

3 : 0.52 * SD에서 6.29 * SD

5 : 0.60 * SD에서 2.87 * SD

10 : 0.69 * SD에서 1.83 * SD

25 : 0.78 * SD ~ 1.39 * SD

50 : 0.84 * SD ~ 1.25 * SD

100 : 0.88 * SD에서 1.16 * SD

500 : 0.94 * SD에서 1.07 * SD

무료 웹 계산기


나는 Monte Carlo를 할 수있다. 나는 단지 더 '과학적인'방식으로하고 싶었다. 그래도 배포판이 정상적이지 않다는 것이 맞으므로이 sd는 테스트에 쓸모가 없습니다.

4
가치있는 것에 대해, 나는 "95 %의 신뢰 구간은 ... 진정한 SD를 포함 할 가능성이있다"라는 말로 불편하다. 샘플 SD에서 계산 된 CI는 실제 모집단 SD를 포함합니다 "). 나는이 문장이 인기 오해를 강화 / 참조 승 바람둥이 생각 여기 CV에 대한 관련 논의는, 예를 들어,.
gung-모니 티 복원

5
"SD의 SD"의 개념과 용어가 너무 미끄러 워 다루기가 어렵다고 생각하는 것은 무엇입니까? 표본 표준 편차는 표준 편차가있는 임의 변수입니다.
매크로

@ 매크로. 귀하의 의견에 감사드립니다. 나는 실질적으로 다시 썼다.
Harvey Motulsky 's

1
@ 궁 신뢰 구간을 올바르게 설명하기 위해 다시 썼습니다.
Harvey Motulsky
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.