의 PDF


15

가정하십시오 . . . , X n 은 알려지지 않은 μ Rσ 2 > 0으로 N ( μ , σ 2 )X1,X2,...,Xn 에서 iidN(μ,σ2)μRσ2>0

Z = X 1ˉ X라고 하자Z=X1X¯S,S는 표준 편차입니다.

Z 에 Lebesgue 가 있음을 알 수 있습니다 pdf

f(z)=nΓ(n12)π(n1)Γ(n22)[1nz2(n1)2]n/22I(0,(n1)/n)(|Z|)

내 질문은이 PDF 파일을 얻는 방법입니다.

문제는 출신 여기 의 UMVUE 찾을 예를 들어 3.3.4에서 P(X1c) . UMVUE를 찾는 논리와 절차를 이해할 수 있지만 pdf를 얻는 방법을 모르겠습니다.

나는이 질문이 관련된 생각 하나

도움을 주셔서 대단히 감사하거나 관련 참조 사항도 언급 할 것입니다.

답변:


14

이 결과에 대해 흥미로운 점은 상관 계수의 분포가 얼마나 보이는지입니다. 이유가 있습니다.


(X,Y) 가 두 변수에 대해 0의 상관 관계와 공통 분산 σ2 를 갖는 이변 량 정상 이라고 가정 합니다. iid 샘플 (x1,y1),,(xn,yn) 립니다. 표본 상관 계수의 분포 가 잘 알려져 있으며, 피셔 (Fisher)가 1 세기 전과 같이 기하학적으로 쉽게 확립

r=i=1n(xix¯)(yiy¯)(n1)SxSy

이다

f(r)=1B(12,n21)(1r2)n/22, 1r1.

(여기서 평소와 같이 ˉ y 는 표본 평균이고 S xS y 는 바이어스되지 않은 분산 추정량의 제곱근입니다.) BBeta 함수 입니다.x¯y¯SxSyB

(1)1(12,21)=Γ(12)Γ(12)Γ(21)=Γ(12)πΓ(21).

을 계산하기 위해 ( 1 , 1 , , 1 )에 의해 생성 된 선 주위 에서 R n로 회전 할 때의 불변성과 동일한 회전에서 샘플 분포의 불변을 이용 하고 y i / S를 선택할 수 있습니다 y 는 성분의 합이 0 인 단위 벡터입니다. 하나의 이러한 벡터에 비례 V = ( N - 1 , - 1 , ... , - 1 ) . 표준 편차는아르 자형아르 자형(1,1,,1)yi/Syv=(n1,1,,1)

Sv=1n1((n1)2+(1)2++(1)2)=n.

따라서 은 다음과 같은 분포를 가져야합니다.r

i=1n(xix¯)(viv¯)(n1)SxSv=(n1)x1x2xn(n1)Sxn=n(x1x¯)(n1)Sxn=nn1Z.

따라서 Z 의 분포를 찾기 위해 을 재조정 하면됩니다 .rZ

fZ(z)=|nn1|f(nn1z)=1B(12,n21)nn1(1n(n1)2z2)n/22

for |z|n1n. Formula (1) shows this is identical to that of the question.


Not entirely convinced? Here is the result of simulating this situation 100,000 times (with n=4, where the distribution is uniform).

Figure

제 히스토그램 플롯의 상관 계수 번째 히스토그램 플롯 동안의 상관 계수 ( X I , V I ) , = 1 , ... , 4 ) A에 대한 모든 반복에 대해 고정 된 무작위로 선택된 벡터 v i . 둘 다 균일합니다. 오른쪽의 QQ- 플롯은 이러한 분포가 본질적으로 동일하다는 것을 확인합니다.(xi,yi),i=1,,4(xi,vi),i=1,,4) vi

R플롯을 생성 한 코드는 다음과 같습니다 .

n <- 4
n.sim <- 1e5
set.seed(17)
par(mfrow=c(1,3))
#
# Simulate spherical bivariate normal samples of size n each.
#
x <- matrix(rnorm(n.sim*n), n)
y <- matrix(rnorm(n.sim*n), n)
#
# Look at the distribution of the correlation of `x` and `y`.
#
sim <- sapply(1:n.sim, function(i) cor(x[,i], y[,i]))
hist(sim)
#
# Specify *any* fixed vector in place of `y`.
#
v <- c(n-1, rep(-1, n-1)) # The case in question
v <- rnorm(n)             # Can use anything you want
#
# Look at the distribution of the correlation of `x` with `v`.
#
sim2 <- sapply(1:n.sim, function(i) cor(x[,i], v))
hist(sim2)
#
# Compare the two distributions.
#
qqplot(sim, sim2, main="QQ Plot")

참고

RA Fisher, 무한한 모집단의 표본에서 상관 계수 값의 빈도 분포 . Biometrika , 10 , 507 항을 참조 3. (인용 통계 켄달의 고급 이론 , 5 에드., 섹션 16.24.)


참조에 대한 링크가 끊어졌습니다.
Sextus Empiricus 2016 년

@Martijn Thank you for checking. I see what you mean--the link works, but it doesn't go to anything relevant! I have fixed it up.
whuber

4

I'd like to suggest this way to get the pdf of Z by directly calculating the MVUE of P(Xc) using Bayes' theorem although it's handful and complex.

Since E[I(,c)(X1)]=P(X1c) and Z1=X¯, Z2=S2 are joint complete sufficient statistic, MVUE of P(Xc) would be like this:

ψ(z1,z2)=E[I(,c)(X1)|z1,z2]=I(,c)fX|Z1,Z2(x1|z1,z2)dx1

Now using Bayes' theorem, we get

fX|Z1,Z2(x1|z1,z2)=fZ1,Z2|X1(z1,z2|x1)fX1(x1)fZ1,Z2(z1,z2)

The denominator fZ1,Z2(z1,z2)=fZ1(z1)fZ2(z2) can be written in closed form because Z1N(μ,σ2n), Z2Γ(n12,2σ2n1) are independent of each other.

To get the closed form of numerator, we can adopt these statistics:

W1=i=2nXin1
W2=i=2nXi2(n1)W12(n1)1

which is the mean and the sample variance of X2,X3,...,Xn and they are independent of each other and also independent of X1. We can express these in terms of Z1,Z2.

W1=nZ1X1n1, W2=(n1)Z2+nZ12X12(n1)W12n2

We can use transformation while X1=x1,

fZ1,Z2|X1(z1,z2|x1)=nn2fW1,W2(w1,w2)=nn2fW1(w1)fW2(w2)

Since W1N(μ,σ2n1), W2Γ(n22,2σ2n2) we can get the closed form of this. Note that this holds only for w20 which restricts x1 to z1n1nz2x1z1+n1nz2.

So put them all together, exponential terms would disappear and you'd get,

fX|Z1,Z2(x1|z1,z2)=Γ(n12)πΓ(n22)nz2(n1)(1(n(x1z1)z2(n1))2)
where z1n1nz2x1z1+n1nz2 and zero elsewhere.

From this,at this point, we can get the pdf of Z=X1z1z2 using transformation.

By the way, the MVUE would be like this :

ψ(z1,z2)=Γ(n12)πΓ(n22)π2θccosn3θdθ
while θc=sin1(n(cz1)(n1)z1) and would be 1 if cz1+n1nz2

I am not a native English speaker and there could be some awkward sentences. I am studying statistics by myself with text book introduction to mathmatical statistics by Hogg. So there could be some grammatical or mathmatical conceptual mistakes. It would be appreciated if someone correct them.

Thank you for reading.

당사 사이트를 사용함과 동시에 당사의 쿠키 정책개인정보 보호정책을 읽고 이해하였음을 인정하는 것으로 간주합니다.
Licensed under cc by-sa 3.0 with attribution required.