분산을 배우는 것은 어렵습니다.
많은 경우에 분산을 잘 추정하기 위해서는 (아마 놀랍게도) 많은 수의 샘플이 필요합니다. 아래에서는 iid 일반 샘플의 "정규"사례에 대한 개발을 보여 드리겠습니다.
가정 , 난 = 1 , ... , n은 독립적으로 N ( μ , σ 2 ) 랜덤 변수. 구간의 너비가 다음과 같이 분산에 대해 100 ( 1 - α ) % 신뢰 구간을 찾습니다.Yii=1,…,nN(μ,σ2)100(1−α)% , 즉 폭이점 추정치의 100 ρ % 가. 예를 들어, ρ = 1 / 2 인 경우 CI의 너비는 점 추정치의 절반입니다 (예 :ρs2100ρ%ρ=1/2 이면 CI는 ( 8 ,s2=10너비가 5 인 13 ) . 점 추정치 주변의 비대칭도 주목하십시오. ( s 2 는 분산에 대한 편견 추정치입니다.)(8,13)s2
대한 "The"(대신 "a") 신뢰 구간 은
( n - 1 ) s 2s2
여기서 χ (2)
(n−1)s2χ2(1−α/2)(n−1)≤σ2≤(n−1)s2χ2(α/2)(n−1),
는자유도가
n-1 인카이 제곱 분포의
β분위수입니다. (이것은
χ2β(n−1)βn−1 가 가우스 설정에서 중추적 수량합니다.)
(n−1)s2/σ2
너비를 최소화하여
그래서 우리는 대한 해결하기 위해 남아있는 N
L(n)=(n−1)s2χ2(α/2)(n−1)−(n−1)s2χ2(1−α/2)(n−1)<ρs2,
n 되도록
(n−1)⎛⎝⎜1χ2(α/2)(n−1)−1χ2(1−α/2)(n−1)⎞⎠⎟<ρ.
99 % 신뢰 구간의 경우 ρ에 대해 를 얻습니다.n=65 및 n에ρ=1 에 대한 ρ = 0.1 . 이 마지막 경우는 간격을 산출한다 (정지를!) 10 % 분산의 점 추정 한 크게.n=5321ρ=0.1
선택한 신뢰 수준이 99 % 미만인 경우 더 낮은 값에 대해 동일한 너비 간격을 얻습니다 . 그러나 n 은 여전히 생각했던 것보다 클 수 있습니다.nn
표본 크기의 도표 비례 폭 ρ n로그 로그 스케일에서 점근 적으로 선형으로 보이는 것을 보여줍니다. 다시 말해 권력 법과 같은 관계입니다. 우리는이 권력 법 관계의 힘을 (거의) 다음과 같이 추정 할 수 있습니다.nρ
α^≈log0.1−log1log5321−log65=−log10log523165≈−0.525,
불행히도 결정적으로 느립니다!
이것은 "정식"사례의 일종으로 계산 방법에 대한 느낌을줍니다. 플롯을 기준으로 데이터가 특히 정상적이지 않습니다. 특히, 눈에 띄는 왜곡이있는 것으로 보입니다.
그러나 이것은 무엇을 기대해야하는지에 대한 간단한 아이디어를 제공해야합니다. 위의 두 번째 질문에 답하려면 먼저 신뢰 수준을 먼저 수정해야합니다. 여기에서는 데모 목적으로 위의 개발에서 99 %로 설정했습니다.