표본 최대 값의 분산은 얼마입니까?


13

랜덤 변수의 최대 값의 분산에 대한 경계를 찾고 있습니다. 즉, 대한 닫힌 형식 수식을 찾고 있는데 , \ mbox {Var} (\ max_i X_i) \ leq B \ enspace, 여기서 X = \ {X_1, \ ldots, X_M \} 은 고정입니다 유한 한 M 랜덤 변수 세트는 \ mu_1, \ ldots, \ mu_M 및 분산 \ sigma_1 ^ 2, \ ldots, \ sigma_M ^ 2를 의미 합니다.B

Var(maxiXi)B,
X={X1,,XM}Mμ1,,μMσ12,,σM2

\ mbox {Var} (\ max_i X_i) \ leq \ sum_i \ sigma_i ^ 2 \ enspace 라고 추론 할 수

Var(maxiXi)iσi2,
있지만이 한계는 매우 느슨합니다. 숫자 테스트는 B=maxiσi2 가 가능할 수 있음 을 나타내는 것으로 보이지만 이것을 증명할 수는 없습니다. 도움을 주시면 감사하겠습니다.

3
( Xi 가 독립적 이라고 가정 하겠습니까?) 추측은 그럴듯하지만 거짓 인 것 같습니다. 예를 들어, Xi 가 CDF 1x1s , 1x , s \ gt 3 인 iid 인 일부 시도를 수행하십시오 s>3. 공통 분산에 대한 최대 분산은 M 이 커짐에 따라 제한없이 증가합니다.
whuber

@ whuber 고마워, 그것은 내가 그 추측을 증명할 수 없었던 이유를 설명한다 :) 나는 Xi 가 독립적 인 경우에 실제로 관심 이있다. 명확히하기 위해, 나는 처음 두 순간 만 사용하는 일반 범위에 주로 관심이 있습니다. 공통 분산보다 더 선명한 일반 경계가 존재하는지 확실하지 않습니다.
Peter

1
나는 당신의 합계가 정확하다고 가정합니다 (정확하다고 가정하면 증거의 스케치를 보는 것이 좋을 것입니다). 예를 들어, 초과하지 않는 분산으로 간격 에서 지원하고 에서 을 지원 하도록 합니다. 그런 다음 , 분산 와 같이 축소하여 원하는만큼 부등식을 강화할 수 있습니다. . X2,,XM[,a]ε2X1[a,]maxiXi=X1σ12σ12+(M1)ε2ε2
whuber

1
iid 데이터의 경우 극값 이론은 표본의 최대 수렴이 이루어지는 분포의 분류를 제공하며 원래 분포의 꼬리에 특정 조건이 적용되어 다양한 종류의 점근 분포를 제공합니다. 따라서 나는 이론에 대해 완전히 익숙하지만 두 순간만을 바탕으로 좋은 바운드를 도출 할 수 있을지 의문입니다.
StasK

답변:


9

임의의 임의 변수 의 경우 가장 일반적인 범위는 원래 질문에 명시된대로 입니다. 증명 스케치는 다음과 같습니다. X, Y가 IID이면 입니다. 아마도 종속 변수의 벡터 주어 ,하자 동일한 조인트 분포와 독립적이어야 벡터. 어떤을 위해 , 우리는 바인딩 조합에 의해이 을 에서 통합 하면 청구 된 불평등이 발생합니다.nXiVar(maxXi)iVar(Xi)E[(XY)2]=2Var(X)(X1,,Xn)(Y1,,Yn)r>0P[|maxiXimaxiYi|2>r]iP[|XiYi|2>r]dr0

경우 확률 사건 IID 지표 다음 확률 이벤트의 지표 인 . 고정 및시키는 제로 경향 우리 얻을 및 .XiϵmaxXinϵ+O(n2ϵ2)nϵVar(Xi)=ϵϵ2Var(maxiXi)=nϵ+O(n2ϵ2)


3

MathOverflow에 대한 질문 은이 질문과 관련이 있습니다.

IID 랜덤 변수의 경우 번째 최고 값을 차수 통계 라고합니다 .k

IID Bernoulli 랜덤 변수의 경우에도 중앙값 이외의 순서 통계량의 분산은 모집단의 분산보다 클 수 있습니다. 예를 들어, 있다 확률 및 확률 및 인 경우, 최대는 확률 인구의 편차가 있으므로, 분산하면서 최대 값은 약 입니다.Xi11/1009/10M=10111/e0.090.23

다음은 주문 통계의 차이에 대한 두 가지 논문입니다.

Yang, H. (1982) "중앙값과 다른 순서 통계의 차이" 황소. Inst. 수학. 아카데 시니카, 10 (2) pp. 197-204

Papadatos, N. (1995) "주문 통계의 최대 분산" 앤 Inst. 통계 학자. 수학, 47 (1) pp. 185-193

두 번째 논문에서 최대의 분산에 대한 상한은 합니다. 그들은 평등이 발생할 수는 없지만 IID Bernoulli 랜덤 변수에 대해서는 더 낮은 값이 발생할 수 있다고 지적합니다.Mσ2

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.