극한 가치 이론-Show : Normal to Gumbel


21

최대 iid Standardnormals는 극한값 이론 에 따라 표준 Gumbel 분포로 수렴됩니다 .X1,,Xn.

우리는 어떻게 그것을 보여줄 수 있습니까?

우리는

P(maxXix)=P(X1x,,Xnx)=P(X1x)P(Xnx)=F(x)n

다음 과 같은 상수의 시퀀스 를 찾거나 선택해야 합니다. F \ left (a_n x + b_n \ right) ^ n \ rightarrow ^ {n \ rightarrow \ infty} G (x ) = e ^ {-\ exp (-x)}an>0,bnR

F(anx+bn)nnG(x)=eexp(x)

당신은 그것을 해결하거나 문학에서 찾을 수 있습니까?

몇 가지 예 pg.6 / 71 이 있지만 일반적인 경우는 아닙니다.

Φ(anx+bn)n=(12πanx+bney22dy)neexp(x)

답변:


23

간접적 인 방법은 다음과 같습니다.
절대적으로 연속적인 배포를 위해 Richard von Mises (1936 년 논문 "La distribution de la plus grande n n eureurs" )는 1964 년 판에서 선택된 것으로 영어로 재생산 된 것으로 보입니다. 그의 논문은 , 최대 샘플이 표준 Gumbel, G (x) 에 수렴하기 위해 다음과 같은 충분한 조건을 제공했습니다 .G(x)

하자 공통 분포의 함수일 랜덤 변수 IID 및 공통의 밀도. 그렇다면N F ( X )F(x)nf(x)

limxF1(1)(ddx(1F(x))f(x))=0X(n)dG(x)

표준 법선에 대한 일반적인 표기법을 사용하여 미분을 계산하면

ddx(1Φ(x))ϕ(x)=ϕ(x)2ϕ(x)(1Φ(x))ϕ(x)2=ϕ(x)ϕ(x)(1Φ(x))ϕ(x)1

참고 . 또한 정규 분포의 경우 입니다. 따라서 한계를 평가해야합니다ϕ(x)ϕ(x)=xF1(1)=

limx(x(1Φ(x))ϕ(x)1)

그러나 는 Mill의 비율이며 증가 함에 따라 표준 법선에 대한 Mill의 비율은 경향 이 있습니다. 그래서(1Φ(x))ϕ(x)1/xx

limx(x(1Φ(x))ϕ(x)1)=x1x1=0

충분한 조건이 충족됩니다.

관련된 시리즈는

an=1nϕ(bn),bn=Φ1(11/n)

추가

이것은 ch에서 온 것입니다. HA David & HN Nagaraja (2003), "Order Statistics"(3d edition) 책의 10.5 .

f ( t ) f ( t ) w ( t )ξa=F1(a) . 또한, 드 하안에 대한 참조입니다 "... : STATISTICA Neerlandica, 30 (4), 161-172 초등학교 소개 샘플 극단 하안, LD (1976) "그러나 표기법 중 일부는 다른 내용이 있기 때문에 조심 드 하안를 - 예를 들어, 책에서 는 확률 밀도 함수이고, de Haan에서 는 책 의 함수 를 의미합니다 (즉, Mill 's ratio). 또한 de Haan은 이미 차별화 된 충분한 조건을 검사합니다.f(t) f(t)w(t)

여기에 이미지 설명을 입력하십시오


귀하의 솔루션을 이해했는지 잘 모르겠습니다. 따라서 표준 정규 CDF로 를 사용했습니다. 나는 충분한 조건이 만족된다는 데 동의했다. 그러나 관련 시리즈 과 은 어떻게 갑작스럽게 주어 집니까? a n b nFanbn
renrenthehamster

@renrenthehamster 나는이 두 부분이 독립적으로 언급되어 있다고 생각합니다 (직접 연결되지 않음).
emcor

그러면 관련 시리즈를 어떻게 얻을 수 있습니까? 어쨌든, 나는이 이슈에 대해 질문을했고 (일반적으로 표준 정규 범위를 벗어난 다른 배포판에 대해)
renrenthehamster

@renrenthehamster 관련 자료를 추가했습니다. 이 시리즈를 찾기 위해 모든 경우에 표준 레시피가 있다고 생각하지 않습니다.
Alecos Papadopoulos

14

질문은 두 가지를 묻습니다. (1) 최대 이 이 적절하게 선택된 시퀀스 및 , 표준 Gumbel 분포 및 (2) 이러한 시퀀스를 찾는 방법. ( X ( N ) - (B)의 N ) / N ( N ) ( B 형 N )X(n)(X(n)bn)/an(an)(bn)

첫 번째는 잘 알려져 있고 Fisher-Tippett-Gnedenko 정리 (FTG)의 원본 논문에 문서화되어 있습니다. 두 번째는 더 어려운 것으로 보인다. 그것이 여기서 해결 된 문제입니다.

이 글타래의 다른 곳에 나타나는 어떤 주장을 분명히하기 위해,

  1. 최대 값은 아무 것도 수렴 되지 않습니다 : 매우 느리지 만 분기됩니다.

  2. Gumbel 배포와 관련하여 다른 규칙이있는 것으로 보입니다. 역전 된 Gumbel 배포판 의 CDF 가 의해 주어진 규모와 위치에 이르기까지 의 관례를 채택 할 것 입니다. 적절하게 표준화 된 최대 iid 정규 변량은 Gumbel 분포가 반대로 수렴됩니다.1exp(exp(x))


직관

때 공통 분포 함수와 IID되는 의 최대 분포 이고 F X ( n )XiFX(n)

Fn(x)=Pr(X(n)x)=Pr(X1x)Pr(X2x)Pr(Xnx)=Fn(x).

정규 분포와 같이 의지 상한이 없으면 함수 의 시퀀스는 제한없이 오른쪽으로 계속 진행됩니다.F의 NFFn

그림 1

대한 부분 그래프 가 표시됩니다. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16Fnn=1,2,22,24,28,216

이 분포 의 모양 을 연구하기 위해 각 분포를 만큼 왼쪽으로 다시 이동 하고 만큼 크기를 조정 하여 비교할 수 있습니다.a nbnan

그림 2

이전의 각 그래프는 중간 값을 으로 설정하고 사 분위수 범위의 단위 길이를 만들기 위해 이동되었습니다 .0

FTG는 이러한 분포 함수가 모든 에서 점진적 으로 규모와 위치까지 극단적 인 값 분포 로 수렴되도록 시퀀스 및 을 선택할 수 있다고 주장합니다 . 하면 정규 분포이고, 특정 제한 극단 값 분포는 최대 위치 및 스케일에 Gumbel와 반대이다.( b n ) x F(an)(bn)xF


해결책

단위 평균과 단위 분산을 갖도록 을 표준화하여 중앙 한계 정리를 모방하고 . 그러나 FTG는 첫 번째 또는 두 번째 모멘트가없는 (연속) 분포에도 적용되기 때문에 부적절합니다. 대신 백분위 수 (예 : 중앙값)를 사용하여 위치를 결정하고 백분위 수 (예 : IQR)의 차이를 확인하여 산포를 결정하십시오. (이 일반적인 접근은 발견에 성공한다 및 위해 어떤 연속 유통.)a n b n에프

표준 정규 분포의 경우 이것은 쉬운 것으로 판명되었습니다! 보자 . 의 분위수 대응 임의의 값이다 위한 . 의 정의를 상기하면 해결책은 다음과 같습니다.F n q x q F n ( x q ) = q F n ( x ) = F n ( x )0<<1에프엑스에프(엑스)=에프(엑스)=에프(엑스)

엑스;=에프1(1/).

따라서 우리는 설정할 수 있습니다

=엑스1/2;, =엑스/4;엑스1/4;; (엑스)=에프(엑스+).

구조적으로 의 중앙값 은 이고 IQR은 이므로 (역전 된 Gumbel의 일부 버전)의 제한 값의 중앙값은 이어야하고 IQR은 이어야합니다 . scale 매개 변수를 로하고 location 매개 변수를 . 중앙값은 이고 IQR은 쉽게 이므로 매개 변수는 다음과 같아야합니다.0G n은 0 1 β α α + β 로그 기록 ( 2 ) β ( 로그 기록 ( 4 ) - 로그 기록 ( 4 / 3 ) )101βαα+β로그로그(2)β(로그로그(4)로그로그(4/))

α=loglog2로그로그(4/)로그로그(4); β=1로그로그(4)로그로그(4/).

및 이 정확히이 값일 필요는 없습니다 . 의 한계 가 여전히이 반전 된 Gumbel 분포 인 경우 근사값 만 필요합니다 . 표준 정규 대한 간단하지만 지루한 분석 은 근사치b n G n F에프

'=로그((4로그2(2))/(로그2(4)))22로그(), '=2로그()로그(로그())+로그(4π로그2(2))22로그()

잘 작동합니다 (가능한 한 간단합니다).

그림 3

하늘색 곡선은 근사 시퀀스 및 사용하여 대한 부분 그래프입니다 . 진한 빨간색 선은 매개 변수 및 반전 된 Gumbel 분포를 그래프로 나타 냅니다. 수렴은 명확합니다 (음수 대한 수렴 속도 는 눈에 띄게 느리지 만). , N = 2 , 2 (6) , (2) 11 , (2) 16 ' N B ' N α β X=2,26,211,216''αβ엑스


참고 문헌

BV Gnedenko, 랜덤 시리즈에서 최대 항의 제한 분포에 관한 정보 . Kotz와 Johnson 에서 1992 년 Springer, Statistics Volume I : Foundations and Basic Theory의 혁신 . Norman Johnson이 번역 함.


위한 Alecos 게시물의 수식 @Vossler 수렴 으로서 . 이 같은 동작 큰 대 . 0 n 0 N(2로그()로그(2π))1/2
whuber

예, 사실입니다. 코멘트를 게시 한 직후에 이것을 깨달았으므로 즉시 삭제했습니다. 감사합니다!
Vossler

@Jess 나는이 대답이 무엇보다도 "the"공식과 같은 것은 없다는 것을 이해하기를 바랐습니다. 과 대한 수많은 공식이b n ..
whuber

@Jess 다른 접근법을 시연하는 것이이 답변을 쓰는 ​​동기 였기 때문에 더 좋습니다. 나는 "답을 적는 데 쓸모가 없다"고 생각한 당신의 주장을 이해하지 못합니다. 왜냐하면 그것은 내가 여기서 한 일이기 때문입니다.
whuber

@Jess이 대화는 전적으로 일방적이므로이 대화를 계속할 수 없습니다 : 나는 당신의 어떤 특징으로 쓰여진 것을 아직 인식하지 못했습니다. 내가 뒤에있는 동안 나는 종료하고 있습니다.
whuber
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.