치수가 증가함에 따라 정규 분포의 밀도


15

내가 묻고 싶은 질문은 이것입니다 : 정규 분포 평균의 1 SD 내의 샘플 비율은 변이 수가 증가함에 따라 어떻게 변합니까?

(거의) 모든 사람들은 1 차원 정규 분포에서 표본의 68 %가 평균의 1 표준 편차 내에서 발견 될 수 있다는 것을 알고 있습니다. 2, 3, 4, ... 치수는 어떻습니까? 나는 그것이 점점 줄어드는 것을 알고 있지만 얼마나 정확하게 (정확하게)? 1, 2, 3 ... 10 치수와 1, 2, 3 ... 10 SD에 대한 수치를 보여주는 표가 있으면 편리합니다. 누구든지 그런 테이블을 가리킬 수 있습니까?

좀 더 컨텍스트-최대 128 채널의 데이터를 제공하는 센서가 있습니다. 각 채널에는 (독립적 인) 전기 노이즈가 발생합니다. 교정 물체를 감지하면 충분한 수의 측정을 평균하고 128 개의 개별 표준 편차와 함께 128 개 채널에서 평균값을 얻을 수 있습니다.

그러나 ... 개별 순간 판독에 관해서는, 데이터는 (최대) 128-dimensonal 벡터 양의 단일 판독과 마찬가지로 128 개별 판독과 같이 반응하지 않습니다. 확실히 이것은 우리가 취하는 몇 가지 중요한 측정 값을 처리하는 가장 좋은 방법입니다 (일반적으로 128의 4-6).

이 벡터 공간에서 "정상적인"변이와 "외부"에 대해 느끼고 싶습니다. 나는 이런 종류의 상황에 적용 할 수있는 테이블과 같은 테이블을 보았을 것입니다. 누가 하나를 가리킬 수 있습니까?


제발-경험적 답변 만 할 수 있습니까-나는 대부분의 수학적 표기법을 이해하지 못합니다.
omatai

답변:


19

걸릴 수 있습니다 각 정상 와 독립적입니다 - 당신이 더 높은 차원으로 무엇을 의미하는지 그의를 생각한다.X=(엑스1,,엑스)(0,나는)엑스나는(0,1)엑스나는

당신은 가 (X와 평균값 사이의 거리가 1보다 작습니다). 이제 확률 에서 발생합니다. 여기서 . 좋은 치 사각 테이블에서 이것을 찾을 수 있습니다 ...| | X | | < 1 | | X | | 2 = X 2 1 + + X 2 d ~ χ 2 ( d ) P ( ξ < 1 ) ξ χ 2 ( d )엑스||엑스||<1||엑스||2=엑스12++엑스2χ2()(ξ<1)ξχ2()

다음은 몇 가지 값입니다.

(ξ<1)10.6820.390.2040.09050.03760.01470.005280.001890.00056100.00017

그리고 2 sd의 경우 :

(ξ<4)10.9520.860.7440.5950.4560.3270.2280.1490.089100.053

R pchisq(1,df=1:10)에서 pchisq(4,df=1:10), 등의 쉼표를 사용하여 이러한 값을 얻을 수 있습니다 .

Post Scriptum 추기경이 주석에서 지적했듯이 이러한 확률의 점근 적 행동을 추정 할 수 있습니다. 변수 의 CDF 는 여기서 는 불완전한 -function 이며 고전적인 .F d ( x ) = P ( d / 2 , x / 2 ) = γ ( d / 2 , x / 2 )χ2() γ(s,y)=y0ts-1e-tdtγΓ(s)=0ts-1e-tdt

에프(엑스)=(/2,엑스/2)=γ(/2,엑스/2)Γ(/2)
γ(에스,와이)=0와이에스1이자형γΓ(에스)=0에스1이자형

경우 부를 프로그램함으로써 정수 반복 통합은 그 의 꼬리 푸 아송 분포의 CDF.P ( s , y ) = e y k = s y k에스

P(s,y)=eyk=sykk!,

이제이 합계는 첫 번째 용어 (주제 덕분에)에 의해 지배됩니다. for big . 가 짝수 때 이것을 적용 할 수 있습니다 : 큰 경우 스털링 공식을 사용한 두 번째 동등성 인 조차도 . 이 공식에서 우리는 점근선 붕괴가 증가함에 따라 매우 빠르다는 것을 알 수 있습니다.P(s,y)yss!eysd

P(ξ<x)=P(d/2,x/2)1(d/2)!(x2)d/2ex/21πde12(dx)(xd)d21πe12xd12d,
d

Elvis 사이트에 오신 것을 환영합니다! 좋은 대답입니다. (+1)
우버

1
(+1) 정답입니다. 고려할 몇 가지 제안은 다음과 같습니다. ( 1 ) 명확성을 위해 가 무엇인지 명시 적으로 만드는 데 도움이 될 수 있습니다 . ( 2 ) "하나의 표준 편차"의 의미에 대해 선택한 선택에 대한 직관적 인 주장을 간단히 제시하십시오. 이러한 맥락에서 그리고 그것이 왜 처음부터 잘 정의되어 있는지, 그리고 ( 3 ) 의 함수로서이 양의 성장에 관한 진술을 추가하십시오 . (영업은 "경험적"답변을 요청하지만, 다른 독자는 작은 수학 부록을 주셔서 감사합니다 수 있습니다.)ξ
추기경

귀하의 의견에 감사드립니다. 나는이 대답이 많은 주목을받을 것이라고 생각하지 않았다! 이것은 차원저주의 좋은 형태라는 것이 사실입니다 ... @ cardinal about (3) 첫 번째 매개 변수가 무한대로 될 때 불완전한 감마 함수와 동일한 점을 알지 못합니다. 두 번째 매개 변수는 고정되어 있습니다. 쉽지 않다! 거친 전공이 가능할 수 있습니다.
Elvis

2
(대해서는 3 계산을 방지하는) 다음 인자를 사용할 수있다 :하자는 심지어 그러한 것일 . 참고 이다 랜덤 변수. 따라서 입니다. 그러나 는 Poisson 프로세스 의 번째 갱신이 1/2의 비율로 완료 될 때까지의 시간 입니다. 따라서. 푸 아송의 꼬리는 주요 용어에 의해 좌우되므로 를 (다시 :=2케이나는=엑스2나는12+엑스2나는2이자형엑스(1/2)엑스2=나는=1케이나는엑스2케이(엑스2<1)=(1/2(0,1)케이)=이자형1/2엑스=케이2엑스/엑스!(엑스2<1)이자형1/22케이/Γ(케이+1)케이=/2 ).
추기경

1
앞에서 언급 한 의견 중 일부는 모든 짝수 대한 정확한 답을 얻는다는 것입니다 . 또한 스털링의 근사법을 사용하면 . (엑스2<1)이자형1/22케이/Γ(케이+1)이자형(1)/2(+1)/2/π
추기경
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.