수업 시간에는 자유도가 어느 정도인지에 대한 직감을 느끼고 발전시키는 데 도움이되는 "단순한"상황을 사용합니다.
그것은 주제에 대한 일종의 "포레스트 검프 (Forrest Gump)"접근 방식이지만 시도해 볼만한 가치가 있습니다.
평균 및 분산 를 알 수없는 정규 모집단에서 나온 10 개의 독립적 관측치 있다고 가정 합니다.X1,X2,…,X10∼N(μ,σ2)μσ2
관찰 결과 및 대한 정보를 종합적으로 얻을 수 있습니다 . 결국 관측치가 하나의 중심 값 주위로 분산되는 경향이 있습니다. 이는 실제적이고 알려지지 않은 값과 비슷해야 하며, 마찬가지로 가 매우 높거나 매우 낮 으면 관측치를 볼 수 있습니다. 매우 높거나 매우 낮은 값을 각각 모으십시오. (실제 값에 대한 지식이없는 경우)에 대한 하나의 좋은 "대체" 는 관측치의 평균 인 입니다. μσ2μμμX¯
또한 관측치가 서로 매우 가까운 경우, 이는 가 작을 것으로 예상 할 수 있고 가 매우 큰 경우 매우 다른 값을 볼 수 있음을 나타냅니다. 대한 하는 . σ2σ2X1X10
및 의 실제 값이어야하는 주 임금을 베팅하려면 돈을 베팅 할 한 쌍의 값 을 선택 해야합니다 . 소수점 이하 200 자리까지 정확하게 추측하지 않으면 월급을 잃는 것만 큼 극적인 것을 생각하지 마십시오 . 아니. 와 가까울수록 더 많은 보상을 얻는 일종의 프 라이밍 시스템을 생각해 봅시다 .μσ2μμσ2
어떤 의미에서 의 가치에 대한 더 좋고 정보가 많고 정중 한 추측은 수 있습니다 . 그런 의미에서, 당신은 추정 것을 주위에 어떤 값이어야합니다 . 마찬가지로, (현재는 필요하지 않음)에 대한 하나의 좋은 "대체" 는 표본 분산 인 이며 대한 올바른 추정치를 만듭니다 .μX¯μX¯σ2S2σ
만약 당신이 그 대체물들이 와 의 실제 값이라고 믿었다면 , 당신은 아마도 당신이 관측치가 당신에게 의 선물을 얻기 위해 스스로 조율하기에 운이 좋았을 가능성이 매우 희박하기 때문에 당신은 잘못되었을 것입니다 는 와 같고 는 . 아니, 아마 그런 일이 없었을 것입니다.μσ2X¯μS2σ2
하지만 당신은 잘못 정말, 정말,에 비트에서 다양한 잘못의 서로 다른 수준에서 할 수있는 정말 ( "; 다음 주에 당신을보고! 안녕은 안녕, 월급"일명) 비참 잘못.
좋아, 대한 추측으로 를 사용 했다고 가정 해 봅시다 . 및 시나리오 만 고려하십시오 . 첫 번째로, 당신의 관찰은 서로 예쁘고 가깝게 앉아 있습니다. 후자의 경우 관찰 내용이 크게 다릅니다. 어떤 시나리오에서 잠재적 손실에 더 관심을 가져야합니까? 두 번째 것을 생각하면 맞습니다. 에 대한 추정치가 있으면 베팅에 대한 자신감이 매우 합리적으로 바뀝니다. 가 클수록 가 변할 것으로 예상 할 수 있습니다 .X¯μS2=2S2=20,000,000σ2σ2X¯
그러나 및 에 대한 정보 외에도 관측 값에는 또는 에 대한 정보가 아닌 순수한 임의의 변동이 있습니다. μσ2μσ2
어떻게 알 수 있습니까?
자, 논쟁을 위해, 하나님이 계시고, 당신에게 와 의 실제 (그리고 지금까지 알려지지 않은) 가치를 구체적으로 말해 줄 수있는 여유를 가지고 있다고 가정 해 봅시다 .μσ
그리고 여기이 lysergic 이야기의 성가신 플롯 트위스트 : 그는 당신에게 알려줍니다 후에 당신이 당신의 내기를 배치했다. 아마도 당신을 계몽하고, 아마도 당신을 준비하고, 아마도 당신을 조롱 할 것입니다. 어떻게 알 수 있습니까?
글쎄, 그것은 관측에 포함 된 와 에 관한 정보를 이제는 쓸모 없게 만듭니다. 관측치의 중심 위치 및 분산 는 더 이상 실제 값인 및 더 가까이 다가가는 데 도움이되지 않습니다 .μσ2X¯S2μσ2
하나님 께 대해 잘 아는 사람의 장점 중 하나는 를 사용하여 를 정확하게 추측하지 못한 정도 , 즉 추정 오류 를 실제로 알 수 있다는 것입니다 .μX¯(X¯−μ)
음, 이므로 (원하는 경우 저를 믿으십시오), (좋아요, 저도 믿어주세요) 그리고 마지막으로
(무엇을 추측합니까?) 또한 또는 대한 정보는 전혀 없습니다 .Xi∼N(μ,σ2)X¯∼N(μ,σ2/10)(X¯−μ)∼N(0,σ2/10)
X¯−μσ/10−−√∼N(0,1)
μσ2
그거 알아? 대한 추측으로 개별 관측치를 취한 경우 추정 오차 는 로 분배됩니다 . 글쎄, 와 를 추정하는 것 사이에 이므로 선택하는 것이 더 나은 방법입니다. 는 개별 보다 에서 덜 타락하기 쉽습니다 .μ(Xi−μ)N(0,σ2)μX¯XiX¯Var(X¯)=σ2/10<σ2=Var(Xi)X¯μXi
어쨌든 도 또는 대해 전혀 정보가 없습니다 .(Xi−μ)/σ∼N(0,1)μσ2
"이 이야기는 끝 날까?" 당신은 생각할 수 있습니다. " 및 에 대해 비 정보적인 임의의 변동이 더 있습니까?"라고 생각할 수도 있습니다 .μσ2
[나는 당신이 후자를 생각한다고 생각합니다.]
예, 있습니다!
대한 추정 오차의 제곱 와 나눈 ,
는 표준 제곱 의 제곱 분포 인 카이 제곱 분포를 가지고 있습니다. 중 하나에 대한 정보 도 ,하지만 당신은 얼굴을 기대한다 다양성에 대한 정보를 전달하지 않습니다.μXiσ
(Xi−μ)2σ2=(Xi−μσ)2∼χ2
Z2Z∼N(0,1)μσ2
이것은 열 번의 관찰 중 하나 하나에 대한 도박 문제 시나리오와 평균에서 자연적으로 발생하는 매우 잘 알려진 분포입니다.
그리고 또한 10 개의 관측치 변형 수집 :
이제 마지막 녀석은 카이 제곱 분포를 갖지 않습니다. 왜냐하면 카이 제곱 분포의 10 개를 합한 것이므로 모두 서로 독립적입니다 ( 이기 때문에).
(X¯−μ)2σ2/10=(X¯−μσ/10−−√)2=(N(0,1))2∼χ2
∑i=110(Xi−μ)2σ2/10=∑i=110(Xi−μσ/10−−√)2=∑i=110(N(0,1))2=∑i=110χ2.
X1,…,X10). 이러한 단일 카이 제곱 분포는 각각 합계에 거의 동일한 기여를하면서 직면해야하는 임의 변동량에 대한 기여입니다.
각 기여의 가치는 다른 아홉 가지와 수학적으로 동일하지 않지만 분배에서 모두 동일한 예상 된 동작을 갖습니다. 그런 의미에서 그것들은 어떻게 든 대칭 적입니다.
이러한 카이-제곱은 각각 해당 합계에서 기대할 수있는 순수 랜덤 변동량에 대한 기여입니다.
100 개의 관측치가있는 경우 위의 합계 는 더 많은 출처가 있기 때문에 더 클 것으로 예상됩니다 .
동일한 행동을하는 각각의 "기여 소스" 를 자유도 라고 합니다.
이제 한 두 단계 뒤로 물러서서, 자유도에 대한 갑작스러운 도착을 수용하기 위해 필요한 경우 이전 단락을 다시 읽으십시오 .
그러나 각 자유도는 반드시 발생할 것으로 예상되고 또는 의 추측 향상에 아무런 영향을 미치지 않는 하나의 변동 단위로 생각할 수 있습니다 .μσ2
문제는 10 가지 등가 변수의 동작에 의존하기 시작한다는 것입니다. 100 개의 관측치가있는 경우 100 개의 독립적으로 동일하게 동작하여 그 합계에 대해 무작위로 무작위 변동이 발생합니다.
10 Chi-squares의 합은 지금부터 10 자유도를 가진 Chi-squared 분포 라고하며 . 우리는 수학적으로 불리는 지금부터 그 하나의 카이 제곱 분포 (에서 밀도에서 파생 될 수는 확률 밀도 함수에서 시작 그것에서 무엇을 기대해야하는지 설명 할 수 와 카이 제곱 분포를 하나 개의 자유도 및 서면 ), 정규 분포의 밀도에서 수학적으로 도출 할 수 있습니다.χ210χ21
"그래서?" --- 당신은 생각하고 있을지도 모릅니다 .- "하나님 께서 내게 말씀하실 수있는 모든 것들 의 와 의 가치를 말해 주실 때만 좋을 것입니다!"μσ2
실제로 전능하신 신이 너무 바빠서 와 의 가치를 말해 주지 않는다면, 여전히 그 10 개의 근원, 즉 10 개의 자유도를 갖게 될 것입니다.μσ2
당신이 하나님 께 반역하고 그분이 당신을 후원하지 않기를 기대하지 않고 혼자서 모든 것을 시도 할 때 상황이 이상해지기 시작합니다 (하하하; 지금 만!).
당신은 와 에 대한 추정량 와 . 더 안전한 내기 방법을 찾을 수 있습니다.X¯S2μσ2
및 위치에서 및 로 위의 합계를 계산할 수 있습니다 .
입니다. 원래 합계와 동일하지 않습니다.X¯S2μσ2
∑i=110(Xi−X¯)2S2/10=∑i=110(Xi−X¯S/10−−√)2,
"왜 안돼?" 두 합계의 제곱 안의 용어는 매우 다릅니다. 예를 들어, 모든 관측치가 보다 큰 경우가있을 수 있습니다 .이 경우 이므로 이지만 이므로 . 입니다. μ(Xi−μ)>0∑10i=1(Xi−μ)>0∑10i=1(Xi−X¯)=0∑10i=1Xi−10X¯=10X¯−10X¯=0
더 나쁜 것은, 두 개 이상의 관측치가 다르면 (항상 드물지 않음) 불평등이 엄격합니다.∑10i=1(Xi−X¯)2≤∑10i=1(Xi−μ)2
"하지만 기다려! 더 있어요!"
에는 표준 정규 분포가 없으며
에는 없습니다 자유도가 1 인 카이 제곱 분포,
카이 제곱 분포가 없습니다. 10 자유도
에는 표준 정규 분포가 없습니다.
Xi−X¯S/10−−√
(Xi−X¯)2S2/10
∑i=110(Xi−X¯)2S2/10
X¯−μS/10−−√
"아무것도 아닌가?"
안 돼 이제 마법이 온다! 참고
또는 이와 동일하게
∑i=110(Xi−X¯)2σ2=∑i=110[Xi−μ+μ−X¯]2σ2=∑i=110[(Xi−μ)−(X¯−μ)]2σ2=∑i=110(Xi−μ)2−2(Xi−μ)(X¯−μ)+(X¯−μ)2σ2=∑i=110(Xi−μ)2−(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−∑i=110(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−10(X¯−μ)2σ2=∑i=110(Xi−μ)2σ2−(X¯−μ)2σ2/10
∑i=110(Xi−μ)2σ2=∑i=110(Xi−X¯)2σ2+(X¯−μ)2σ2/10.
이제 우리는 그 알려진 얼굴로 돌아갑니다.
첫 번째 항에는 자유도가 10 인 카이 제곱 분포가 있고 마지막 항에는 자유도가 1 인 카이 제곱 분포 (!)가 있습니다.
우리는 단순히 동일하게 동작하는 10 개의 가변성 변동 원으로 카이 제곱을 두 부분으로 나눕니다. 한 부분은 하나의 변동 원이있는 카이-제곱이고 다른 하나는 우리가 증명할 수있는 다른 것입니다 (신념의 도약? WO가 승리합니까? )는 9 (= 10-1)의 동일하게 동작하는 변동성 소스가 있고 두 부분이 서로 독립적 인 카이 제곱입니다.
이것은 이미 좋은 소식입니다. 이제 배포판이 나왔습니다.
아아, 그것은 를 사용하는데, 우리는 접근 할 수 없습니다 (하나님 께서 우리의 투쟁을 지켜 보시면서 자신을 즐겁게하고 계신다는 것을 기억하십시오).σ2
그래서,
이므로
따라서
표준 정규 분포는 아니지만 분포에서 추출 할 수있는 분포입니다. 표준 법선의 밀도와 자유 도로 카이 제곱 .
S2=110−1∑i=110(Xi−X¯)2,
∑i=110(Xi−X¯)2σ2=∑10i=1(Xi−X¯)2σ2=(10−1)S2σ2∼χ2(10−1)
X¯−μS/10−−√=X¯−μσ/10√Sσ=X¯−μσ/10√S2σ2−−−√=X¯−μσ/10√(10−1)S2σ2(10−1)−−−−−−√=N(0,1)χ2(10−1)(10−1)−−−−−√,
(10−1)
매우 똑똑한 한 사람이 20 세기 초에 수학 [^ 1]을했고 의도하지 않은 결과로 그의 보스를 스타우트 맥주 업계의 절대 세계 지도자로 만들었습니다. 나는 William Sealy Gosset (일명 Student; 예, 그 학생, 배포판)과 Saint James 's Gate Brewery (일명 Guinness Brewery )에 관해 이야기하고 있습니다.t
[^ 1] : @whuber는 아래 의견에서 Gosset이 수학을하지 않았지만 대신 추측 했다고 말했습니다 ! 나는 그 당시 어떤 위업이 더 놀라운 지 정말로 모른다.
내 사랑하는 친구 는 자유도 가 분포 의 기원입니다 . 표준 정규의 비율과 파도의 예측할 수없는 차례로, 샘플 평균을 사용할 때 받아야 추정 오차의 예상되는 동작을 설명하는 바람, 자유의도,로 나누어 독립적 인 카이 제곱의 제곱 루트 는 를 추정 하고 를 사용하여 의 변동성을 추정합니다 .t(10−1)X¯μS2X¯
당신은 간다. 엄청나게 많은 기술적 인 세부 사항으로 깔개에 심하게 휩쓸려 갔지만, 전 임금을 위험에 걸기위한 하나님의 개입에만 의존하지는 않았습니다.