iid Gaussians의 최대 값에 대한 가장 강력한 결과는 무엇입니까? 실제로 가장 많이 사용됩니까?


9

iid가 주어지면 임의의 변수를 고려하십시오.X1,,Xn,N(0,1)

Zn:=max1inXi.

질문 : 이 랜덤 변수에 대한 가장 "중요한"결과는 무엇입니까?

"중요도"를 명확하게하기 위해 어떤 결과가 논리적 결과와 같은 다른 결과를 가져 오는가? 실제로 가장 많이 사용되는 결과는 무엇입니까?

보다 구체적으로, (이론적) 통계 학자들 사이에서 Zn적어도 무의식적 으로 "기본적으로 같은" 2logn 과 같은 민속 지식인 것 같습니다 . ( 이 관련 질문을 참조하십시오 .)

그러나 이러한 유형의 관련 결과가 많이 있으며, 대부분 동일하지 않거나 서로를 암시하지 않는 경우가 있습니다. 예를 들어 ,

(1)Zn2logna.s.1,

다른 것도 없다면 확률과 분포의 해당 결과를 의미합니다.

그러나 그것은 또한 겉보기에 관련된 결과를 암시하지도 않습니다 ( 이 다른 질문 참조 ).

(2)limnEZn2logn=1,

( 49 페이지의 연습 2.17 ) 또는 다른 민속적 결과 :

(3)EZn=2logn+Θ(1).

무증상으로, 각 에 대해 ( 증거에 대해서는 여기 참조 ),n

(4)clognEZn2logn

약간의 작은 . 대해서도 유사한 결과가 표시 될 수 있습니다 은 크게 오른쪽으로 치우쳐 있기 입니다.c|Zn|Zn

이 마지막 결과의 증거는 다른 결과의 증거보다 훨씬 간단합니다. 첫 번째 점근 적 결과가 다른 모든 점근 적 결과를 암시하여 그 결과를 이해하는 데 모든 시간과 에너지에 집중할 수 있다고 확신했습니다. 그러나 다시 말하지만, 그것은 사실이 아니기 때문에, 내가 집중해야 할 것이 분명하지 않습니다.

1987 년에 발간 된 2 차 개정판 인 Galambos의 265-267 쪽, 극단 주문 통계에 대한 점근 론 이론 . pp .

Boucheron, Lugosi, Massart, 농도 불평등 : 비대칭 독립 이론 . 따로 : 이 책은 실제로 해당 결과에 대해 Galambos를 인용하지만 Galambos의 어느 곳에서도 언급 할 수는 없습니다. 제가 언급 한 첫 번째 결과 만 있습니다.


1
MathJax에서 \ dots를 사용할 때 결과는 때때로 문맥에 따라 \ ldots를 사용한 것처럼 보이고 때로는 \ cdots를 사용한 것처럼 나타납니다. 이 질문에서 \ dots를 \ ldots로 바꿨습니다.
X_1, \dots, X_n, \dots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1)X1,,Xn,N(0,1)
Michael Hardy

@MichaelHardy 오 항상 그것이 중심에 있다고 생각했습니다. 수정 해 주셔서 감사합니다!
Chill2Macht

답변:


4

모든 확률 적 응용에서 가장 기본적인 목표는 분포이며, 여기서 모멘트와 제한 특성이 도출 될 수 있습니다. 따라서, 가장 의미있는 "중요한"결과는 전체 분포 함수 (해당하는 해당 밀도 함수)입니다. 실제로이 분포 결과는 이미 나열한보다 기본적인 점근 적 특성보다 조명이 적을 수 있습니다. 논리적으로 이러한 점근 적 결과를 암시하지만, 우리가 을 변경함에 따라 극단적 인 가치의 변화하는 본질을 이해하는 데 그 결과가 더 밝아 질 것 입니다.FZn(z)=Φn(z)n

최대 IID 표준 정규 랜덤 변수의 경우 극단적 인 값 속성을 잘 이해하고 있다는 것이 귀하의 질문에서 분명합니다. 이러한 속성은 모두 의 분포 함수에서 논리적으로 도출 할 수 문제에서 가장 기본적인 객체입니다. 많은 경우와 마찬가지로 가장 기본적인 목적은 반드시 가장 밝게 나타나는 것은 아니므로 모든 결과를 알고 문제의 다른 측면을 밝히는 것과 관련이 있다는 것을 알게 될 것입니다.Zn


이 답변에 감사드립니다-감사합니다. 대한 분포 함수에서 이러한 모든 속성을 파생시키는 방법에 대한 참조를 알고 있습니까? 나는 이것이 "민속"또는 "손 잡기"이기 때문에 이것을 설명하는 것을 찾는 데 극도로 어려움을 겪고 있습니다. Zn
Chill2Macht

기록을 위해 링크를 읽었으며 도움이되지 않습니다. 그래서 제가 질문을했습니다.
Chill2Macht

1
추천 할 구체적인 참고 자료는 없지만 이러한 결과는 극단적 인 가치 이론에 관한 책에서 도출 될 것이라고 생각합니다. 해당 주제에 대한 대학원 수준의 텍스트를 찾아서 파생물을 찾을 수 있는지 확인하는 것이 좋습니다.
벤-복원 모니카

1

WIP : 진행중인 작업

팔로 잉 p. 래머 1946 370 통계 수학적 방법을 정의여기서 는 표준 정규 분포 의 누적 분포 함수입니다 . 그 정의의 결과로 우리는 거의 확실하게 보장합니다 .

Ξn=n(1Φ(Zn)).
ΦN(0,1)0Ξnn

주어진 실현을 고려 우리의 샘플 공간을. 그런 의미에서 은 및 의 함수 이고 은 및 의 함수입니다 . 고정 된 경우 은 의 결정 함수 이고 은 및 의 결정 함수로 하여 문제를 단순화 할 수 있습니다. 거의 모든 대한 결과를 보여 주려고합니다.ωΩZnnωΞnZn,nωωZnnΞnZnnωΩ결과를 비 결정적 분석에서 비 결정적 설정으로 전송할 수 있습니다.

팔로 잉 p. 크레이머의 1946 년 374 통계의 수학적 방법, 우리는 (어떤 주어진에 대한 것을 보여줄 수 있다는 (내가 다시 와서 나중에 증거를 제공하는 것을 목표로) 순간 가정 다음 점근 확장 보유 (사용) 부품 별 통합 및 정의 ) :ωΩΦ

(~)2πnΞn=1ZneZn22(1+O(1Zn2))  as  Zn.

분명히 우리가 그 어떤을위한 , 및 거의 확실하게 증가 함수이다 로 , 따라서 우리는 고정 된 (거의 확실히 모든) 동안 그 전반에 걸쳐 다음과 무슨에서 주장 :Zn+1ZnnZnnnω

Znn.

따라서 우리는 ( 은 점근 적 동등성을 나타냄 ) 다음 과 같습니다 .

2πnΞn1Zne1Zn2  as  Znn.

우리가 따르는 것을 어떻게 진행 하는가는 본질적으로 지배적 균형방법에 해당 하며, 우리의 조작은 다음과 같은 정리로 공식적으로 정당화됩니다.

보조 정리 : 있다고 가정 와 같은 및 (따라서 ). 그런 다음 대수 및 거듭 제곱 법칙의 구성, 덧셈 및 곱셈 (본질적으로 " 다항식 "함수)을 통해 형성되는 함수 가 주어지면 : 이어야합니다 .다시 말해, 이러한 "폴리 로그"기능 은 점근 적 동등성을 유지합니다 .f(n)g(n)nf(n)g(n)hn

h(f(n))h(g(n)).

이 정리의 진실은 정리 2.1 의 결과이다 . 여기에 쓰여진대로 . 또한 다음 내용은 여기에있는 유사한 질문 에 대한 답변 의 확장 된 (자세한 내용) 버전입니다 .

양쪽의 로그를 취하면 다음과 같은 결과를 얻습니다.

(1)log(2πΞn)lognlogZnZn22.

이것은 Cramer가 다소 엉성한 곳입니다. 그는 단지 " 이 묶여 있다고 가정한다"고 말합니다 . 그러나 이 적절하게 묶여 있음을 보여주는 것은 실제로 다소 사소한 것 같습니다. 이것에 대한 증거는 본질적으로 Galambos의 265-267 페이지에서 논의 된 내용의 일부인 것 같지만, 나는 여전히 그 책의 내용을 이해하려고 노력하고 있다는 것을 확신하지 못한다.ΞnΞn

어쨌든 이라고 표시 할 수 있다고 가정logΞn=o(logn) 하면 항이 항을 지배하기 때문에 다음과 같습니다 .Zn2/2logZn

lognZn22Zn2logn.

이것은 이미 우리가 보여주고 싶은 것의 대부분이기 때문에 다소 좋습니다. 다시 말해서 캔을 걷어차는 것만으로도 주목할 가치가 있습니다. 이제 우리는 거의 확실하게 . 반면, 은 최대 iid 연속 난수 변수에 대해 동일한 분포를 가지므로 다루기 어려울 수 있습니다.ΞnΞn

어쨌든, 만약 그대로라면, 어떤 에 대해서도 이라고 결론을 내릴 수 있습니다 이는 로 입니다. 위의 점근 적 동등성을 유지하는 폴리 로그 함수에 대한 정리를 사용하여이 표현식을 로 다시 대체하여 다음 을 얻을 수 있습니다.Zn2lognZn2logn(1+α(n))α(n)o(1)n(1)

log(2πΞn)lognlog(1+α)12log212loglognlogn2αlognα2logn.

log(Ξn2π)log(1+α)+12log2+12loglogn+2αlogn+α2logn.

여기에서 우리는 더욱 가서해야 한다고 가정 거의 확실logΞn=o(loglogn)  as  n . 다시 말하지만 모든 Cramer는 " 이 제한되어 있다고 가정합니다"라고 말합니다 . 그러나 모든 사람이 말할 수 있기 때문에 사전에 대한 것입니다 으로, 거의 사람이 있어야한다고 분명히 보인다 크레이머의 주장의 실체 것으로 보인다 거의 확실.ΞnΞn0XinnΞn=O(1)

그러나 어쨌든, 그것을 믿는다 고 가정하면, 포함하지 않는 지배적 인 용어 는 입니다. 이후 , 팔로우 그 , 명확 이므로 포함하는 지배적 인 용어 는 입니다. 따라서 우리는 ( 또는 으로 모든 것을 나누면 )α12loglognα=o(1)α2=o(α)log(1+α)=o(α)=o(o(αlogn))α2αlogn12loglogn2αlogn

12loglogn2αlognαloglogn4logn.

따라서 이것을 다시 위의 것으로 바꾸면 다음과 같이됩니다.

Zn2lognloglogn22logn,

에 대해 특정 사항을 믿는다 고 가정 합니다.Ξn

동일한 기술을 다시 해시합니다. 이후 , 그것은 또한 다음Zn2lognloglogn22logn

Zn2lognloglogn22logn(1+β(n))=2logn(1loglogn8logn(1+β(n))),

경우 . (1)로 직접 대체하기 전에 약간 단순화하자. 우리는 그것을 얻는다 :β(n)=o(1)

logZnlog(2logn)+log(1loglogn8logn(1+β(n)))log(O(1))=o(logn)log(2logn).

Zn22logn12loglogn(1+β)+(loglogn)28logn(1β)2o((1+β)loglogn)logn12(1+β)loglogn.

이것을 다시 (1)로 바꾸면 다음과 같은 사실을 알 수 있습니다.

log(2πΞn)lognlog(2logn)logn+12(1+β)loglognβlog(4πΞn2)loglogn.

따라서 우리는 거의 확실하게 결론을 내립니다.

Zn2lognloglogn22logn(1+log(4π)+2log(Ξn)loglogn)=2lognloglogn+log(4π)22lognlog(Ξn)2logn.

이것은 Cramer 's 1946 수학 통계 방법론 p.374의 최종 결과에 해당합니다. 단, 여기서 오류 항의 정확한 순서는 제공되지 않습니다. 이 용어를 한 번 더 적용하면 오차항의 정확한 순서를 알 수 있지만 어쨌든 우리가 관심을 갖는 iid 표준 법선의 최대 값에 대한 결과를 증명할 필요는 없습니다.


위의 결과를 감안할 때, 거의 확실하게 :

()Zn2lognloglogn+log(4π)22lognlog(Ξn)2lognZn=2lognloglogn+log(4π)22lognlog(Ξn)2logn+o(1).

2. 그런 다음 기대의 선형성에 따라 다음과 같습니다.

EZn=2lognloglogn+log(4π)22lognE[log(Ξn)]2logn+o(1)EZn2logn=1E[logΞn]2logn+o(1).

그러므로 우리는

limnEZn2logn=1,

우리가 보여줄 수있는 한

E[logΞn]=o(logn).

은 모든 연속 랜덤 변수에 대해 동일한 분포 를 때문에 표시하기 어렵지 않을 수 있습니다 . 따라서 우리는 위에서 두 번째 결과를 얻습니다.Ξn

1. 마찬가지로, 우리는 위의 내용을 거의 확실하게 가지고 있습니다.

Zn2logn=1log(Ξn)2logn+o(1),.

따라서 우리가 그것을 보여줄 수 있다면 :

(*)log(Ξn)=o(logn) almost surely,

위의 첫 번째 결과를 보여 드리겠습니다. 결과 (*)는 분명히 암시하여 위의 첫 번째 결과를 제공합니다.E[log(Ξn)]=o(logn)

또한 위의 ( ) 증명에서 우리는 거의 확실하게 (또는 적어도 비슷한 것으로) 가정해야하므로 우리가 ( ) 를 표시 할 수 있다면 우리는 거의 확실하게 을 보여줄 필요가 있을 것이므로 증명할 수 있다면 다음 결론에 즉시 도달 할 수있을 것입니다.Ξn=o(logn)Ξn=o(logn)()

3. 그러나 우리가이 결과를 가지고 있다면, 나는 이후 어떻게 가질 지 이해할 수 없습니다. 입니다. 그러나 최소한EZn=2logn+Θ(1)o(1)Θ(1)

EZn=2logn+O(1).


따라서 우리는 보여주는 방법에 대한 질문에 대답하는 데 집중할 수 있습니다

Ξn=o(logn) almost surely.

우리는 또한 (~)에 대한 증거를 제공하는 과감한 작업을 수행해야하지만, 아직 앉아서 아직 시도하지는 않았지만 미적분학이며 확률 이론이없는 내 지식을 최대한 활용해야합니다.

먼저 문제를 더 쉽게 해결할 수있는 방식으로 문제를 다시 표현하기 위해 일련의 사소한 일을 살펴 보겠습니다 (정의상 ).Ξn0

Ξn=o(logn)limnΞnlogn=0ε>0,Ξnlogn>ε only finitely many timesε>0,Ξn>εlogn only finitely many times.

하나는 또한 그것을 가지고 있습니다 :

Ξn>εlognn(1F(Zn))>εlogn1F(Zn)>εlognnF(Zn)<1εlognnZninf{y:F(y)1εlognn}.

이에 따라 모든 대해 정의하십시오 .n

un(ε)=inf{y:F(y)1εlognn}.

따라서 위의 단계는 다음을 보여줍니다.

Ξn=o(logn) a.s.P(Ξn=o(logn))=1P(ε>0,Ξn>εlogn only finitely many times)=1P(ε>0,Znun(ε) only finitely many times)=1P(ε>0,Znun(ε) infinitely often)=0.

다음과 같이 작성할 수 있습니다.

{ε>0,Znun(ε) infinitely often}=ε>0{Znun(ε) infinitely often}.

서열 로 균일하게 커지고 우리가 체결 할 수 있도록, 감소하는 이벤트 감소된다 (또는 으로 과 같이 적어도 어쨌든 단조로운) . 따라서 사건의 단조 적 순서에 관한 확률 공리로 다음과 같은 결론을 내릴 수 있습니다.un(ε)ε

{Znun(ε) infinitely often}
ε0

P(ε>0,Znun(ε) infinitely often)=P(ε>0{Znun(ε) infinitely often})=P(limε0{Znun(ε) infinitely often})=limε0P(Znun(ε) infinitely often).

따라서이 충분 모든 것을 보여주기 위해 ,ε>0

P(Znun(ε) infinitely often)=0

물론 상수 시퀀스의 한계는 상수입니다.

다음은 약간의 망치 결과입니다.

정리 4.3.1., p. 254 of Galambos, 극단 주문 통계에 대한 점근 론 , 2 판. 하자 공통 비축 연속 분포 함수와 변수 IID 수 및하자 되도록 비 감소 시퀀스 일 과 같은 비 감소된다. 그런 다음 , 에 따라 X1,X2,F(x)unn(1F(un))un<sup{x:F(x)<1}

P(Znun infinitely often)=0 or 1
j=1+[1F(uj)]exp(j[1F(uj)])<+ or =+.

그 증거는 기술적 인 것이며 5 페이지 정도 걸리지 만 궁극적으로 Borel-Cantelli lemmas 중 하나의 결과로 밝혀졌습니다. 이 분석에 필요한 부분 만 사용하기 위해 증거를 정리하려고 노력할뿐 아니라 가우시안 경우에는 더 짧을 수도 있지만 여기에 입력하지 않는 가정 만 사용할 수도 있습니다. 그러나 숨을 참는 것은 권장하지 않습니다. 이 경우 이므로 조건이 비어 있고 은 이므로 명확하게 않습니다.ω(F)=+n(1F(n))εlogn

어쨌든 요점은 우리가 그것을 보여줄 수 있다면이 정리에 호소하는 것입니다.

j=1+[1F(uj(ε))]exp(j[1F(uj(ε))])=j=1+[εlogjj]exp(εlogj)=εj=1+logjj1+ε<+.

대수 법률 지수에 대해 대수적 성장이 임의의 대 법률 성장보다 느리기 때문에 (대수 및 지수는 단조 보존입니다. 따라서 와 이전의 불평등은 과 변수의 변경 으로 인해 항상 충분히 크게 유지하는 것으로 볼 수 있습니다 .)loglognαlognlognnαnlognn

j=1+logjj1+εj=1+jε/2j1+ε=j=1+1j1+ε/2<+,

때문에 P- 시리즈는 모두 수렴 알려져 , 및 과정의 의미는 .p>1ε>01+ε/2>1

따라서 위의 정리를 사용하여 모든 에 대해 이며, 거의 확실합니다.ε>0P(Znun(ε) i.o.)=0Ξn=o(logn)

여전히 표시해야합니다 . 예를 들어, 위의 내용을 따르지 않습니다.logΞn=o(loglogn)

1nlogn=o(logn),logn+loglogno(logn).

그러나, 시퀀스 특정 한 것을 표시 할 수 있다면, 임의위한 , 다음 팔로우를 않는다는 . 이상적으로 는 위의 정리를 사용하여 대해 이것을 표시하고 (심지어 사실이라고 가정하지만) 아직은 할 수 없습니다.xnxn=o((logn)δ)δ>0log(xn)=o(loglogn)Ξn

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.