답변:
간접적 인 방법은 다음과 같습니다.
절대적으로 연속적인 배포를 위해 Richard von Mises (1936 년 논문 "La distribution de la plus grande n n eureurs" )는 1964 년 판에서 선택된 것으로 영어로 재생산 된 것으로 보입니다. 그의 논문은 , 최대 샘플이 표준 Gumbel, G (x) 에 수렴하기 위해 다음과 같은 충분한 조건을 제공했습니다 .
하자 공통 분포의 함수일 랜덤 변수 IID 및 공통의 밀도. 그렇다면N F ( X )
표준 법선에 대한 일반적인 표기법을 사용하여 미분을 계산하면
참고 . 또한 정규 분포의 경우 입니다. 따라서 한계를 평가해야합니다
그러나 는 Mill의 비율이며 증가 함에 따라 표준 법선에 대한 Mill의 비율은 경향 이 있습니다. 그래서
충분한 조건이 충족됩니다.
관련된 시리즈는
추가
이것은 ch에서 온 것입니다. HA David & HN Nagaraja (2003), "Order Statistics"(3d edition) 책의 10.5 .
f ( t ) f ( t ) w ( t ) . 또한, 드 하안에 대한 참조입니다 "... : STATISTICA Neerlandica, 30 (4), 161-172 초등학교 소개 샘플 극단 하안, LD (1976) "그러나 표기법 중 일부는 다른 내용이 있기 때문에 조심 드 하안를 - 예를 들어, 책에서 는 확률 밀도 함수이고, de Haan에서 는 책 의 함수 를 의미합니다 (즉, Mill 's ratio). 또한 de Haan은 이미 차별화 된 충분한 조건을 검사합니다.
질문은 두 가지를 묻습니다. (1) 최대 이 이 적절하게 선택된 시퀀스 및 , 표준 Gumbel 분포 및 (2) 이러한 시퀀스를 찾는 방법. ( X ( N ) - (B)의 N ) / N ( N ) ( B 형 N )
첫 번째는 잘 알려져 있고 Fisher-Tippett-Gnedenko 정리 (FTG)의 원본 논문에 문서화되어 있습니다. 두 번째는 더 어려운 것으로 보인다. 그것이 여기서 해결 된 문제입니다.
이 글타래의 다른 곳에 나타나는 어떤 주장을 분명히하기 위해,
최대 값은 아무 것도 수렴 되지 않습니다 : 매우 느리지 만 분기됩니다.
Gumbel 배포와 관련하여 다른 규칙이있는 것으로 보입니다. 역전 된 Gumbel 배포판 의 CDF 가 의해 주어진 규모와 위치에 이르기까지 의 관례를 채택 할 것 입니다. 적절하게 표준화 된 최대 iid 정규 변량은 Gumbel 분포가 반대로 수렴됩니다.
때 공통 분포 함수와 IID되는 의 최대 분포 이고 F X ( n )
정규 분포와 같이 의지 상한이 없으면 함수 의 시퀀스는 제한없이 오른쪽으로 계속 진행됩니다.F의 N
대한 부분 그래프 가 표시됩니다. n = 1 , 2 , 2 2 , 2 4 , 2 8 , 2 16
이 분포 의 모양 을 연구하기 위해 각 분포를 만큼 왼쪽으로 다시 이동 하고 만큼 크기를 조정 하여 비교할 수 있습니다.a n
이전의 각 그래프는 중간 값을 으로 설정하고 사 분위수 범위의 단위 길이를 만들기 위해 이동되었습니다 .
FTG는 이러한 분포 함수가 모든 에서 점진적 으로 규모와 위치까지 극단적 인 값 분포 로 수렴되도록 시퀀스 및 을 선택할 수 있다고 주장합니다 . 하면 정규 분포이고, 특정 제한 극단 값 분포는 최대 위치 및 스케일에 Gumbel와 반대이다.( b n ) x F
단위 평균과 단위 분산을 갖도록 을 표준화하여 중앙 한계 정리를 모방하고 . 그러나 FTG는 첫 번째 또는 두 번째 모멘트가없는 (연속) 분포에도 적용되기 때문에 부적절합니다. 대신 백분위 수 (예 : 중앙값)를 사용하여 위치를 결정하고 백분위 수 (예 : IQR)의 차이를 확인하여 산포를 결정하십시오. (이 일반적인 접근은 발견에 성공한다 및 위해 어떤 연속 유통.)a n b n
표준 정규 분포의 경우 이것은 쉬운 것으로 판명되었습니다! 보자 . 의 분위수 대응 임의의 값이다 위한 . 의 정의를 상기하면 해결책은 다음과 같습니다.F n q x q F n ( x q ) = q F n ( x ) = F n ( x )
따라서 우리는 설정할 수 있습니다
구조적으로 의 중앙값 은 이고 IQR은 이므로 (역전 된 Gumbel의 일부 버전)의 제한 값의 중앙값은 이어야하고 IQR은 이어야합니다 . scale 매개 변수를 로하고 location 매개 변수를 . 중앙값은 이고 IQR은 쉽게 이므로 매개 변수는 다음과 같아야합니다.G n은 0 1 β α α + β 로그 기록 ( 2 ) β ( 로그 기록 ( 4 ) - 로그 기록 ( 4 / 3 ) )
및 이 정확히이 값일 필요는 없습니다 . 의 한계 가 여전히이 반전 된 Gumbel 분포 인 경우 근사값 만 필요합니다 . 표준 정규 대한 간단하지만 지루한 분석 은 근사치b n G n F
잘 작동합니다 (가능한 한 간단합니다).
하늘색 곡선은 근사 시퀀스 및 사용하여 대한 부분 그래프입니다 . 진한 빨간색 선은 매개 변수 및 반전 된 Gumbel 분포를 그래프로 나타 냅니다. 수렴은 명확합니다 (음수 대한 수렴 속도 는 눈에 띄게 느리지 만). , N = 2 , 2 (6) , (2) 11 , (2) 16 ' N B ' N α β X
BV Gnedenko, 랜덤 시리즈에서 최대 항의 제한 분포에 관한 정보 . Kotz와 Johnson 에서 1992 년 Springer, Statistics Volume I : Foundations and Basic Theory의 혁신 . Norman Johnson이 번역 함.