만약


9

다음 설정 가정
하자 Zi=min{ki,Xi},i=1,...,n . 또한 XiU[ai,bi],ai,bi>0 입니다. 또한 ki=cai+(1c)bi,0<c<1ki 는 각각의 지지체의 경계의 볼록한 조합이다. c 는 모든 i에 공통입니다 i.

나는 생각 나는의 분포가 권리 : 그것은이다 혼합 분배 . 연속 부분, 와 불연속성 및 불연속 부분이 있습니다. 확률 질량 집중 :Zi

Xi[ai,ki),Zi=XiPr(Zizi)=ziaibiai

Pr(Zi=ki)=Pr(Xi>ki)=1Pr(Xiki)
=1kiaibiai=1(1c)(biai)biai=c

따라서 모든

FZi(zi)={0zi<aiziaibiaiaizi<ki1kizi

혼합 된 "이산 / 연속"질량 / 밀도 함수의 경우 간격 [a_i, k_i] 외부에서 0 이지만 균일 한 U (a_i, b_i) , \ frac {1} 의 밀도 인 연속 부분이 있습니다. {b_i-a_i} 이지만 a_i \ le z_i < k_i의 경우 z_i = k_i 에서 양의 확률 질량 c> 0집중시킵니다 .0[ai,ki]U(ai,bi)1biaiaizi<kic>0zi=ki

결국, 그것은 현실에 대한 통일로 요약됩니다.

임의 변수 S_n \ equiv \ sum_ {i = 1} ^ n Z_i 의 분포 및 / 또는 모멘트 Sni=1nZin \ rightarrow \ infty 로 유도하거나 무언가에 대해 말하고 싶습니다n .

경우 생성 말은 의 독립적이며, 이는 보이는 로서 . 근사치로도 해당 부분을 "무시"할 수 있습니까? 그런 다음 간격"검열되지 않은"상태가되기 위해 검열 된 제복의 합처럼 보이는 . 따라서 일부 중앙 제한 정리가있을 수 있습니다. 그래서 어떤 제안?XiPr(Sn=inki)=cn0n[i=1nai,i=1nki)

추신 : 이 질문은 관련이 있습니다 . 검열 된 변수의 합의 분포를 유도 하지만 @Glen_b의 대답은 내가 필요하지 않습니다-근사를 사용 하더라도이 일을 분석적으로 수행해야합니다. 이것은 연구이므로 숙제처럼 취급하십시오-일반적인 제안이나 문헌에 대한 언급은 충분합니다.


필요한 경우 의 분포 를 로 적절한 여기서 는 Borel 세트입니다. ZiμZi(B)=P(ZiB)=Bg(t)dt+cIB(ki)gB
Zen

@ 젠 나는 이미 배포가 불 연속적이라는 질문에 썼다. 또한 의 RHS는 이 가 의 밀도를 나타내지 만 의 확률을 나타내며 나는 콤팩트 표기법을 선호합니다. ff[ai,ki)ki
Alecos Papadopoulos

내가 아는 한, 사용한이 표기법 은 pdf였으며 pmf는 존재하지 않습니다. 우리는 혼합 분포를 정확하게 설명하기위한 적절한 수학적 언어를 가지고 있습니다. 나는 당신이 당신의 연구를 출판 할 때이 표기법이 받아 들여질 지 의심 스럽다. 물론 제 의견입니다. 항상 원하는대로해야합니다. f
Zen

@Zen Publishing은 먼 길을 가고 있습니다. 실제로 리뷰어는 확립되지 않은 표기법을 볼 때 눈살을 찌푸립니다. 이것은 여러 줄로 단계적 분포를 설명하고자 할 때 간단히 표현한 것입니다. 예를 들어 이전 의견에서 사용한 것과 같이 기존의 표기법과 반대되는 표기법에 대한 "인수 주장"은 없습니다.
Alecos Papadopoulos

답변:


5

Henry의 팁을 따르고 Lyapunov를 확인하십시오 . 와 올바르게 작동 하는 한 분포가 혼합되어 있다는 사실은 문제가되지 않습니다 . 각 에 대해 , , 특정 경우의 시뮬레이션은 정규성이 정상임을 나타냅니다.δ=1aibiai=0bi=1ki=2/3i1

xbar <- replicate(10^4, mean(pmin(runif(10^4), 2/3)))
hist((xbar - mean(xbar)) / sd(xbar), breaks = "FD", freq = FALSE)
curve(dnorm, col = "blue", lwd = 2, add = TRUE)

CLT


실제로 꽤 정상입니다. 알아 둘만 한. CLT의 일반적인 조건은 여기서 결코 문제가되지 않았습니다. 제 질문은 점근 적 결과를 왜곡하고 수정 된 CLT가 필요한 다른 미묘한 문제가 있는지 여부였습니다. 시뮬레이션에 따르면 더 많은 변수가 합에 들어감에 따라 불연속 불연속성이 실제로 무시할 수있는 것으로 나타났습니다.
Alecos Papadopoulos

구체적이지 않지만 문제가 없습니다. 인덱스 와 무관하게 유한 한 숫자로 생각하십시오 . 그것들은 성장함에 따라 증가하거나 감소 할 수 있으며 (특정 규칙 없음), 그들 중 어느 것도 다른 것보다 불균형 적으로 크지 않습니다 ... 그럼에도 불구하고 "비교할 수있는"실체의 크기 차이를 나타냅니다. Lindeberg의 상태는 가장 확실합니다ii
Alecos Papadopoulos

좋은. 다음 단계로 행운을 빕니다. 흥미로운 문제인 것 같습니다.
Zen

3

힌트 :

가 고정되어 있고 가 독립적 이라고 가정하면 각 의 평균 및 분산 를 . 예를 들어 당신은 알고 . cXiμiσi2Ziμi=E[Zi]=cai+ki2+(1c)kiki=cai+(1c)bi

그런 다음 및 가 너무 빨리 커지지 않으면 Lyapunov 또는 Lindeberg 조건 을 사용하여 라는 결론과 함께 중앙 제한 정리를 적용 할 수 있습니다 는 표준 정규 분포로 수렴하거나 손으로 흔드는 의미로 는 대략적으로 평균 및 분산 .aibi11nσi2(1nZi1nμi)1nZi1nμi1nσi2


감사. 와 아무런 문제가 없으며 , 인덱스와 함께 성장하지 않고 변동합니다. 그래서 당신은 본질적으로 CLT가 혼합 분포의 랜덤 변수를 포함 할 수 있다고 말하고 있습니까? aibi
Alecos Papadopoulos

예를 들어, 및 가 고정 된 경우 유한 분산을 갖는 독립적으로 동일하게 분포 된 랜덤 변수를 가지므로 중심 한계 정리가 적용됩니다. 이것이 혼합 분포인지 여부는이 결과에 영향을 미치지 않습니다. 내가 말하고있는 것은 평균과 분산이 합리적으로 유지된다면 랜덤 변수가 독립적이지만 동일하게 분포되지 않은 경우로 이것을 확장 할 수 있다는 것입니다. aibi
Henry

2

이 질문에 대한 나의 주된 걱정은 내가 조사하고있는 경우에 "평소대로"CLT를 적용 할 수 있는지에 대한 것이었다. 사용자 @Henry는 사용자가 @Zen이 시뮬레이션을 통해 그것을 보여줄 수 있다고 주장했다. 따라서 격려하여 이제 분석적으로 증명하겠습니다.

먼저해야 할 것은 혼합 분포를 갖는이 변수에 "일반적인"모멘트 생성 기능이 있는지 확인하는 것입니다. 나타내고 예상 값 , 표준 편차와의 중심 및 스케일링 된 버전 의해 . 변화 -의 가변 식을 적용하면, 우리는 연속 부분 인 것을 발견 의 모멘트 생성 함수 는 μiZiσiZiZ~i=Ziμiσi

fZ~(z~i)=σifZ(zi)=σibiai
Z~i
M~i(t)=E(ez~it)=ez~itdFZ~(z~i)=a~ik~iσiez~itbiaidzi+cek~it

M~i(t)=σibiaiek~itea~itt+cek~it
함께
k~i=kiμiσi,a~i=aiμiσi

소수를 사용하여 도함수를 나타내면 모멘트 생성 함수를 올바르게 지정한 경우 이후 중심 및 스케일링 된 랜덤 변수입니다. 그리고 실제로 미분을 계산하고 L' Hopital 's rule을 여러 번 적용하여 (제로의 MGF 값이 한계를 통해 계산되어야하므로) 대수 조작을 수행하여 처음 두 개의 동등성을 확인했습니다. 세 번째 평등은 너무 성가신 것으로 판명되었지만 나는 그것이 가지고 있다고 믿습니다.

M~i(0)=1,M~i(0)=E(Z~)=0M~i(0)=E(Z~i2)=Var(Z~i)=1

그래서 우리는 적절한 MGF를 가지고 있습니다. 2 차 테일러 확장을 0으로하면

M~(t)=M~(0)+M~(0)t+12M~(0)t2+o(t2)

M~(t)=1+12t2+o(t2)

이것은 특성 함수가 (여기서 는 허수를 나타냄) .i

ϕ~(t)=1+12(it)2+o(t2)=112t2+o(t2)

특성 함수특성에 따라 의 특성 함수 는 다음과 같습니다.Z~/n

ϕ~Z~/n(t)=ϕ~Z~(t/n)=1t22n+o(t2/n)

독립적 인 랜덤 변수가 있기 때문에 의 특성 함수 는 다음과 같습니다.1ninZ~i

ϕ~1ninZ~i(t)=i=1nϕ~Z~(t/n)=i=1n(1t22n+o(t2/n))

그때

limnϕ~1ninZ~i(t)=limn(1t22n)n=et2/2

숫자 가 어떻게 표현 되는지에e 의해 . 그것은 그래서 마지막 항은 표준 정규 분포의 특성 기능입니다 발생,에 의해 레비의 연속성 정리 , 우리는이

1ninZ~idN(0,1)

이것이 CLT입니다. 변수가 중심 및 스케일 버전 고려하고 MGF / CHF의 2 차 테일러 확장을 고려 하면 변수가 동일하게 분포되지 않고 "사라진다" 는 사실에 유의하십시오 . 동일하고 모든 차이점은 무조건 사라지는 나머지 용어로 압축됩니다. Z

우리가 평균 행동을 고려할 때 모든 개별 요소 에서 개별 수준의 특유의 행동이 사라진다는 사실은 혼합 분포를 갖는 무작위 변수와 같은 불쾌한 생물을 사용하여 매우 잘 드러나 있다고 생각합니다.


정말 멋지다, Alecos. 내 생각은 그 주장이 와 의 보다 구체적인 조건에 의존해야한다는 것이다 . 예를 들어 이면 증거가 빨리 깨 집니까? (응용 프로그램에서 이것이 발생하지 않는다는 것을 알고 있습니다.) 어떻게 생각하십니까? aibi(biai)0
Zen

@Zen 독립적이지만 동일하게 분포되지 않은 RV의 차이에 관한 문제는 매우 미묘한 것으로 아직 명확하게 이해하지 못한다고 생각합니다. 알려진 Lyapunov 또는 Lindeberg 조건은 CLT가 보유 하기충분 합니다. 이러한 조건이 충족되지 않더라도 CLT가 유지되는 경우가 있습니다. 따라서 우리가 분산을 묶지 않으면 단일 답변이 없으며 문제는 완전히 사례에 따라 달라집니다. Billingsley의 책조차도 그 문제에 대해 명확하지 않습니다. 문제는 나머지가 어떻게 보일지, 우리가 그것에 대해 말할 수있는 것입니다.
Alecos Papadopoulos
당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.