이 질문에 대한 @NRH의 대답은 표본 표준 편차의 편향에 대한 훌륭하고 간단한 증거를 제공합니다. 여기에서는 정규 분포 표본에서 표본 표준 편차 (원래 포스터의 두 번째 질문)에 대한 기대치를 명시 적으로 계산합니다.
포인트들의 세트의 바이어스 표본 분산 있다엑스1, . . . , x엔
에스2= 1n - 1∑나는 = 1엔( x나는− x¯¯¯)2
가 정규 분포를 따르는 경우,엑스나는
(n−1)s2σ2∼χ2n−1
여기서 는 실제 분산입니다. 분포 확률 밀도χ 2 kσ2χ2k
P ( X ) = ( 1 / 2 )k / 2Γ(k/2)xk/2−1e−x/2
이를 사용하여 의 예상 값을 도출 할 수 있습니다 .s
E(s)=σ2n−1−−−−−√E(s2(n−1)σ2−−−−−−−−√)=σ2n−1−−−−−√∫∞0x−−√(1/2)(n−1)/2Γ((n−1)/2)x((n−1)/2)−1e−x/2 dx
이는 기대 값의 정의와 가 분산 변수 이라는 사실에 따릅니다 . 요령은 이제 정수가 다른 밀도 가되도록 항을 재배 열하는 것입니다 . χ2χ2s2(n−1)σ2−−−−−−√χ2χ2
E(s)=σ2n−1−−−−−√∫∞0(1/2)(n−1)/2Γ(n−12)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)∫∞0(1/2)(n−1)/2Γ(n/2)x(n/2)−1e−x/2 dx=σ2n−1−−−−−√⋅Γ(n/2)Γ(n−12)⋅(1/2)(n−1)/2(1/2)n/2∫∞0(1/2)n/2Γ(n/2)x(n/2)−1e−x/2 dxχ2n density
이제 우리는 마지막 줄이 1과 같다는 것을 알고있다. 왜냐하면 그것은 밀도 이기 때문이다 . 약간의 상수를 단순화 χ2n
E(s)=σ⋅2n−1−−−−−√⋅Γ(n/2)Γ(n−12)
따라서 의 치우침 은s
σ−E(s)=σ(1−2n−1−−−−−√⋅Γ(n/2)Γ(n−12))∼σ4n
을 합니다.
n → ∞
유한 대해이 바이어스가 0이 아님을 알기 어렵지 않으므로 샘플 표준 편차가 바이어스됨을 증명합니다. 바이어스 아래에는 에 대한 의 함수 , 빨간색의 및 파란색의 이 플롯됩니다 .N σ = 1 1 / 4 N엔엔σ= 11 / 4 N